Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

词典里有很多多音字的标注是错误的 #21

Open
ililu2000 opened this issue Feb 19, 2021 · 6 comments
Open

词典里有很多多音字的标注是错误的 #21

ililu2000 opened this issue Feb 19, 2021 · 6 comments

Comments

@ililu2000
Copy link

比如
孟山都 meng shan dou
应该是
孟山都 meng shan du

@ipcjs
Copy link
Contributor

ipcjs commented Feb 19, 2021

目前主仓库的代码没有考虑多音字的情况。

我fork的版本,针对多音字会把所有可能的组合都组词,结果是这样:

孟山都	meng shan dou
孟山都	meng shan du

无论你打du还是dou,都能打出来😏
如果你用的是繁体词库,可以试试我维护的版本,详细区别:https://github.com/ipcjs/fcitx5-pinyin-zhwiki/releases/latest

@wtaochina
Copy link

小鹤双拼下 孟山都 是 meng shan dou,没有meng shan du

@wtaochina
Copy link

wtaochina commented Feb 25, 2021

主仓库的代码没有考虑多音字,多音字估计还是有点小问题,遇到这种情况可以用楼上ipcjs大大的fork版本

@CoelacanthusHex
Copy link

古文是标注错误的重灾区,比如
不与秦塞(se)通人烟
傅说(yue)举于版筑之间

@ipcjs
Copy link
Contributor

ipcjs commented Jul 14, 2022

@CoelacanthusHex 是被兩字詞污染了詞庫?

“維基大詞典”,主要還是解決詞庫量的問題,注音的準確率不能保證
還是像我維護的那個fork一樣,只保留三字或以上的詞組更好🤔️

@CoelacanthusHex
Copy link

@CoelacanthusHex 是被兩字詞污染了詞庫?

“維基大詞典”,主要還是解決詞庫量的問題,注音的準確率不能保證 還是像我維護的那個fork一樣,只保留三字或以上的詞組更好🤔️

应当不是有词干扰,就是注音的时候只标注了一个错误的音的问题

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants