All Chinese characters Chinese words simple non code unified input method improvement, structure blocks all Chinese characters with 287 constructions are known to the public or to remember the sound block series; every word the most Chinese characters / 4/5 block sound, namely its spelling block, as the Germans can according to the Concise Rules from German word directly read the word, Chinese can also according to the Concise Rules from Chinese font / form directly read word spelling block / word spelling block; recite words / word spelling block and then determine its block codes or spreading codes, spreading codes Chinese dictionary is all about one hundred thousand million standard shape / form / simple no code sequence. The application of the invention, any Chinese characters Chinese word dictionary / document retrieval, check the pieces of code that check the word / word; computer mobile phone input key / write / read the end spread code / extended code / PA or code / code / type / write / sound is simply read the word / words Chinese; as one of the world's main text will approximate English for mass processing.
【技術實現步驟摘要】
本專利技術涉及全部漢字漢詞簡易無重碼統一輸入法改進。
技術介紹
漢字輸入的要害在字詞編碼而不在現有編碼基礎上的“智能化”設計。至今,各種流行鍵盤輸入法的普通用戶在電腦/手機上平均輸1000漢字究竟要擊多少次鍵、費多長時間,如果把實際發生且理當計入的翻頁點選、不時糾錯、頻繁移目都計算進去?哪里有可信統計數據?“智能化”事實上把很多選擇的麻煩推給了用戶。欲筑高樓,必先堅地基,基于不完善字詞碼的智能化輸入法沒有也難以突破漢字輸入的整體低效瓶頸,更無法兼用于漢字檢索;所謂完善的漢字碼,衡量標準終歸一條,即大眾據之能快易統一地輸入檢索全部漢字漢詞。申請人始終認為一種文字通用一種檢索法兼輸入法兼存儲法(如果該種文字需要事先存儲),才是計算機時代包括漢字處理在內的任何文字處理之大道;漢字編碼不屬于人類那些永無止境的事務,萬碼奔騰的結局是萬碼歸一。專利技術專利申請CN104571593A在申請人先前多個專利技術專利/申請基礎上,將拼塊碼方法推向漢字處理最大限度的通用性,即通用于漢語全部字詞,通用于電腦、手機及其它信息處理設備,通用于鍵盤、手寫、語音等各種輸入方式,通用于輸入、存儲、檢索、寫記等各個處理領域;基于拼塊碼,一旦啟動國家規模的軟、硬件全面配套工程,十幾億華人將從無一能快易處理所有漢字漢詞的過去,很快進入初小以上全都能快易處理所有漢字漢詞的未來。基本理念十分簡單,就是盡量讓大眾能從母語任何字詞形直接讀音同時完成該字詞的輸 ...
【技術保護點】
全部漢字漢詞簡易無重碼統一輸入法改進,其特征是包括下列步驟:漢語拼音恢復本來寫法,再ü/ao換成y/au,聲調不計;每個字中按筆順的相繼數畫稱為該字的一個子塊,n畫字恰有n(n+1)/2個子塊;字中的幾個子塊稱為相繼的,若按筆順其中每一個的末畫與下一個的首畫構成該字的上下兩畫;字中無公共筆畫的子塊間的相交、相接關系按筆畫間的同名關系理解;用來組成全部漢字的下列287子塊稱為構塊,簡稱塊:構塊表表中字號較大的稱為根,較小的稱為枝;根的拼音屬于常識,枝的拼音規定是其根的拼音,塊的拼音稱為塊音;塊/非筆形根若是字則稱塊字/根字;多畫塊的下列3種變形之一若不變各畫間關系且未成別塊則視同原塊:1)“未”除外的塊中某一畫的伸縮或位移;2)塊中某一“乚”換為之一,或“丿”換為“丨”,或“一”換為“乛”;3)塊中某一畫或其末段換為它的對偶,這里稱“一”與“丨”與“亅”、“丶”與對偶;視同“豐/冎//電”,視同“凹/巴/了/予/或/虎”;塊碼是塊音首字母,但依次有下列5種變通之一:1)若“耳、十”及其枝除外的塊音與“〇、一、二、…、九”之一的塊音在不區別起頭的sh和s、n和I及結尾的ng和n這一前提下相 ...
【技術特征摘要】
1.全部漢字漢詞簡易無重碼統一輸入法改進,其特征是包括下列步驟:
漢語拼音恢復本來寫法,再ü/ao換成y/au,聲調不計;
每個字中按筆順的相繼數畫稱為該字的一個子塊,n畫字恰有n(n+1)/2個子塊;字中的
幾個子塊稱為相繼的,若按筆順其中每一個的末畫與下一個的首畫構成該字的上下兩畫;
字中無公共筆畫的子塊間的相交、相接關系按筆畫間的同名關系理解;
用來組成全部漢字的下列287子塊稱為構塊,簡稱塊:
構塊表
表中字號較大的稱為根,較小的稱為枝;根的拼音屬于常識,枝的拼音規定是其根的拼
音,塊的拼音稱為塊音;
塊/非筆形根若是字則稱塊字/根字;
多畫塊的下列3種變形之一若不變各畫間關系且未成別塊則視同原塊:1)“未”除外的
塊中某一畫的伸縮或位移;2)塊中某一“乚”換為之一,或“丿”換為“丨”,或“一”
換為“乛”;3)塊中某一畫或其末段換為它的對偶,這里稱“一”與“丨”與“亅”、“丶”與
對偶;視同“豐/冎//電”,視同“凹/巴/了/
予/或/虎”;
塊碼是塊音首字母,但依次有下列5種變通之一:1)若“耳、十”及其枝除外的塊音與
“〇、一、二、…、九”之一的塊音在不區別起頭的sh和s、n和I及結尾的ng和n這一前提下相
同,則塊碼是對應阿拉伯數字;2)若塊音末字母為a,則塊碼是a;3)若塊音末字母為o,則塊
碼是o;4)若塊音末三字母為uei,則塊碼是v;5)“木”的塊碼是w;
依次遵守下列3條簡明規則逐一拆下某字的相繼構塊直至拆盡該字的全部筆畫,得到
的惟一一串塊稱為該字的塊順:1)塊少拆得的塊盡量少,但多畫字拆成至少2塊,其構塊
“口、冂、廠、”依次力避拆散,字的型子塊單獨分拆,且“*”的余部
自成一塊除非拆得的塊更少,“斗、頭”拆成3塊;2)字大拆得的諸根字總畫數盡量大,但相
繼兩塊依次力避相交、相接;3)先小先拆得的塊畫數盡量小;
當字含有筆順難判的子塊,其筆順約定使拆分維持“塊少、字大、先小”3規則,但字中包
含該子塊的列分明方塊先寫左列后寫右列;
字的塊順含n個塊,該字即稱n塊字;
字的拼塊音按下表簡明確定:
詞的拼塊音按下表簡明確定:
詞字數
拼塊音
1
字拼塊音
2
首字拼塊音首次末塊音+末字拼塊音首末塊音
3
首字拼塊音首末塊音+次字拼塊音首末塊音+末字拼塊音首塊音
4
首3字拼塊音首塊音+末字拼塊音首末塊音
≥5
首4及末字拼塊音首塊音詞中每個阿拉伯數字和漢語拼音字母看做1塊根字;2/3字詞若首字/首次字的拼塊音
少于3/2塊音,則從后續字的拼塊音中增取塊音力求詞的拼塊音各字均攤地達到5塊音;
高頻詞的拼塊音按下表簡明確定:
詞字數
≤2
3
≥4
拼塊音
各字音+末字首末塊音
各字音
首3及末字音這里一字的字音特指該字被看做根時賦有的塊音;
由字/詞的拼塊音將其中每一塊音換為同塊碼,即成該字/詞的拼塊碼;
設依次按降頻、CJK字符集、擴展A集、B集、…、各字塊數、各塊畫數、各畫筆形、各字結構
排列的若干字的拼塊碼都是S1S2S3S4,規定第t字的擴碼是S1S2S3S4后綴t-1個...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。