rime_wanxiang

rime_wanxiang

Rime万象拼音输入方案:标准版与增强版可选,词库基于AI筛选和语料辅助筛选精干高效,配合全新语法模型,输入不再纠结。PRO版本支持10种双拼,6种辅助码,并且可以扩展更多,支持中英混输,内置超级注释、带调全拼输入码显示、快符与重复上屏、候选手动排序、tips等功能扩展,大大增强使用体验。  Q群:11033572

Stars: 1110

Visit
 screenshot

Rime Wanxiang is a pinyin input method based on deep optimized lexicon and language model. It features a lexicon with tones, AI and large corpus filtering, and frequency addition to provide more accurate sentence output. The tool supports various input methods and customization options, aiming to enhance user experience through lexicon and transcription. Users can also refresh the lexicon with different types of auxiliary codes using the LMDG toolkit package. Wanxiang offers core features like tone-marked pinyin annotations, phrase composition, and word frequency, with customizable functionalities. The tool is designed to provide a seamless input experience based on lexicon and transcription.

README:


万象系列方案 Ask DeepWiki


万象拼音——基于深度优化的词库和语言模型

万象词库与万象语言模型 是一种带声调的词库,经过AI和大基数语料筛选、加频,结合语言模型获得更准确的整句输出。还结合了中英文混输,一套词库,多种用法,具体可以点击链接了解优势

优势

  1. 词库词语全部加音调

  2. 设计6种辅助码,头部使用全拼编码,可以转化为任何双拼编码

    • 词库解码顺序为:全拼拼音;墨奇码;鹤形;自然码;虎码首末;五笔前2;汉心码
    • 因此,万象拼音支持拼音和辅助码任意两两组合
  3. 其他类型辅助码用户可以通过LMDG工具包进行词库辅助码刷新,使用zrm-fuzhu方案包,替换为刷新后的词库即可使用。

万象词库中的带声调拼音标注+词组构成+词频是整个万象项目的核心,是使用体验的基石,方案的其它功能皆可自定义,我希望使用者可以基于词库+转写的方式获得输入体验 万象词库问题收集反馈表


效果大赏

效果.png


版本差异 标准版 增强版
方案文件 wanxiang.schema.yaml wanxiang_pro.schema.yaml
是否调频 默认开启 默认关闭
用户词记录 无差别自动记录,词库混乱 需手动造词``引导,词库可控
用户词位置 wanxiang.userdb zc.userdb
辅助码 有基于声调的辅助 有7种辅助码可选,同时兼容声调辅助
简码 全拼开启基于转写的简码,双拼未开启 有携带部分数据但未配置(自己设置的才是自己的)
词库格式 你➩nǐ➩1000 你➩nǐ;re➩1000

新手快速入门

不了解rime基础的可以参考友情链接,初步了解rime运行的些许特性:

oh my rime

rime参数配置

整个rime配置生态都是通的,里面有非常完整的使用方法,(诸如放到哪里、换个皮肤、什么是用户目录。。。)

友情提示: 如果你是第一次使用万象,可以不要用你过往经验来定义万象,按如下的步骤将万象跑起来后,体验一下万象的功能,然后学习一下万象的各项内容之后再考虑。

①快速运行:

  1. 将方案文件置于用户目录中,直接部署,等待部署完成后,

  2. 输入以下指令(斜杠引导)切换为对应的双拼/全拼,切换后按照提示重新部署,完成。

  3. 这样的指令能帮你一次性完成4个补丁文件的输入类型修改,运行逻辑:根目录无自定义文件则复制custom文件夹相关文件出来并修改为对应的输入方案,如果根目录存在则只修改输入方案,不进行复制,因此不会被覆盖。

  4. ios仓输入法,平台特殊,需要额外去:方案文件管理-使用键盘文件覆盖应用文件,才能完成文件变更

/flypy    → 小鹤双拼
/mspy     → 微软双拼
/zrm      → 自然码
/sogou    → 搜狗双拼
/abc      → 智能ABC
/ziguang  → 紫光双拼
/pyjj     → 拼音加加
/gbpy     → 国标双拼
/lxsq     → 乱序17
/pinyin   → 全拼
/zrlong   → 自然龙(反查是全拼)
/hxlong   → 汉心龙(反查是全拼)

②进阶custom patch法(已经尽量为你简化)强烈推荐,适用于长期稳定使用:

其实快速运行中我们已经完成了custom patch的部署,里面还预设了一些示例,这些例子只是例子,请务必详细阅读每一行,保留有用的删除无用的,千万不要改完双拼就万事大吉了,每一行详细查阅、理解、修改。custom是对对应方案文件的最后一道补丁,是真正属于你自己的配置文件,他不会被升级所覆盖。

方案提供了custom文件夹,预设了一些文件与教程,请不要删除相关文件,根据文件夹中内容进行相关修改变更:

wanxiang.custom.yaml是对wanxiang.schema.yaml的补丁以此类推
可以打补丁的类型:
schema,default,weasel,squirrel

注意不要删除和变更每一个custom的表头。

更详细参照:🚀 Rime 万象拼音输入方案 新手安装配置指南

③脚本更新:

脚本的下载地址 万象方案更新脚本。这里以win版本的小狼毫为例,如果你是中文系统请下载更新脚本的 powershell 非utf-8版本,具体文件名:rime-wanxiang-update-windows.ps1 。在使用万象之前,请安装小狼毫,安装小狼毫的过程中,请一切保持默认即可,等你熟悉之后可以自定义。本入门最终会带你一步步设置使用小鹤双拼+墨奇辅助码的方案。

  1. 下载更新脚本:直接点击上面地址首页右边最新 release 链接,然后下载对应的 rime-wanxiang-update-windows.ps1 文件即可。下载完成后,直接双击运行刚刚下载的ps1脚本。如果杀毒报错,请将你下载的文件恢复后,添加到信任文件。如果执行一闪而过、或者遇到乱码再尝试下载 utf-8 版本,具体文件名:rime-wanxiang-update-windows-utf-8.ps1。如果提示权限不足,可以在 powershell 终端中执行 Set-ExecutionPolicy -ExecutionPolicy Bypass -Scope CurrentUser 再尝试运行下载的 ps1 脚本。
  2. 脚本执行后,需要你确认你使用的是全拼还是双拼用户,如果你是全拼用户,请根据提示输入 0 后回车。如果你双拼用户,需要你确认你使用的辅助码类型,默认的万象方案支持汉心、简单鹤、墨奇、虎码、五笔、自然码共计6种辅助码类型。如果没有你想要的辅助码类型,也不要着急,可在熟悉万象之后自定义。根据提示输入你使用的辅助码类型的数字后回车即可。这里我按墨奇辅助码输入。更不要着急怎么选择双拼方案,后面会告诉你的。
  3. 脚本继续执行,提示选择是否全部更新,不要管,你是新手,直接选全部更新,输入 0 回车。然后就默默的等待脚本执行完后,按任意键退出即可。默认情况下,万象的双拼方案为自然码。
  4. 在使用脚本更新之前,务必使用进阶custom patch法维护好你的配置,更新不会覆盖custom.yaml类文件

答疑

为什么词库这么大,我见过只有单字携带辅助码的方案,词库可以缩小吗?

在这里我借助wiki深入阐述一下这个问题并解答这些问题:万象词库PRO的设计理念

为什么PRO版本默认关闭调频的说明 enable_user_dict: false # 是否开启自动调频,true为开启

功能一览

辅助码

辅助码可以在输入一个确定得拼音后面继续输入一个部首的读音,使得这个字出现在靠前甚至第一位。这种方式易于理解,无须记忆字根,一切基于拼音得基础上。例如:

截图_选择区域_20240704121653.png

功能1 (仅PRO) 直接辅助--如果想要 字显示在前面 那么在本方案下提供两种方式,第一种就是辅助码声母,vf继续输入j 也就是金字旁得声母即可出现结果,如果还是出现不了你要的结果,可以输入另外主体字的声母来继续缩小范围。

截图_选择区域_20240704121809.png

句子中间或者单字输入时需要输入全位辅助码时由于与双拼词语重码,因为我们设计的基本辅助码是2位,加上双拼共4位,由于在整句中我们为了整句输入的顺畅,不会将4码聚拢作为优先级较高的选择,这样会在很多时候造成你想打的句子缩成一团变成全辅助码的词汇。此时可以通过追加/的方式使其聚拢,这种方式是由于我们是直接辅助码导致的,如果我们通过一个符号引导辅助码,那么在输入时要每一个都用到符号,而采用这种方式我们只需要在必要的时候使用/节省了输入的按键开支,下面由两个图片说明问题:

截图_选择区域_20240821093644.png

截图_选择区域_20240821093701.png

功能2 (仅PRO) 间接辅助--除以上直接使用辅助外,我们还支持中间加入/来引导辅助码的输入,即:功能1是"nire/" 在有需求的时候末尾增加斜杠能让系统侧重于单字,平时则永远在动态切分,这个模式也是比较吃词库的,当你的词组完整,遇到的异常就少,当词组不完整,你想输入三个字2+2=2编码结构,恰好辅助码与双拼编码重合就会出现3+3的聚拢,此时将你想输入的三个字放入词库中,这个问题就得到了解决,还有得项目通过Lua重新切分来解决,看似巧妙,实际上比较吃操作,影响节奏,无疑万象在很多选择上面选择了更加难的路线,用词库的全面性来托举. 而在功能2中是"ni/re",也就是说辅助码必须经过/来引导,如果你不输入/它将与普通双拼无异,优点是类似vsg能够派生出"中国",更适用于新手辅助码或者叫辅助码轻量使用者.

功能3 第二种方式是通过反查字库来定位,只是通过不同的方案实现,在输入主要拼音后,通过符号` 来引导进入反查状态,引导后继续输入jn金 则包含金的字就会被选出来;

截图_选择区域_20240704121635.png

引导后继续输入mu 木则带的字就会被选出来

截图_选择区域_20240704121611.png

功能4 通过 拼音状态下 ``〔反查:部件|笔画〕 来引导拆字模式 举例 假设你不认识,你可以通过雨和辰 来合并输入,拼音状态输入后,继续输入其它字符字母az会消失如下图,输入 yu if 即雨 辰,结果出现了我们要的震字,且给出了辅助码 yiy是雨的声母yi是辰的声母ch,同时兼容通过hspnz代表横竖撇捺折五笔画。功能3是功能4的另一种表现形式,或者叫用法。这个功能依赖wanxiang_reverse.schema.yaml方案,可以通过custom配置成任意全拼双拼以匹配主方案一致的输入方式,因此是不是输入jn=jin需要看你具体的双拼类型。

截图_选择区域_20240928112256.png

功能5 句子中间或者单字输入时需要可以使用更精确的聚拢方式"声调辅助",7890数字按键代表1234声,轻声归并到4声,在功能4中我们可以在双拼两码后面3个编码的位置任意插入声调与两位辅助码混合使用,就是除了不用斜杠了,我们还顺序自由了,下面由两个图片说明问题,其实在键盘上想要安排四个按键是很难得,不是占用这个按键就是占用另外的,还有得朋友觉得离得远,还有得更是不需要声调,要把候选做成9个。这些都是存在的情况,现在的处理也是妥协后的结果,要想完全不占用按键类似的办法可以改成大写字母来代表,像地球拼音则是使用大于小于号这一片的符号来表示,我们的词库有声调这个基础,一定程度上还是要利用起来:

截图_选择区域_20250512101814.png

截图_选择区域_20250512101752.png

截图_选择区域_20250512101713.png

功能6 混合输入:字母、汉字、数字、用于连接的特殊符号等组合,以及英文混输,我们统一放在了wanxiang_mixedcode.schema.yaml混合编码方案里,此功能无需引导,直接输入,不参与组句,类似:1000wclips、AD钙奶、PN结、Type-C以及纯英文,同样可以通过custom来定义你所使用的双拼。

整合说明 万象方案整合度很高,我们不希望使用户文件夹变得复杂,功能5中我们将两类习惯的五笔画和多分拆字和两分拆字整合到了一起,可以认为是4个挂接方案;在功能6中,我们将 英文输入、中英混合编码、以及一些其他混合编码整合到了一起,共享方案转写,两个功能都保证了可配置性,都能与你所使用的双拼契合, 对于词库也都整合到了dicts里面,为了能更好的统一更新和分发,仓库中我们支持基础版本词库、携带pro的辅助码版本词库、英文词库、混合词库4个类别,在release中各自归类,最终做到了根目录15个文件、4个文件夹示人,其中的custom目录还携带了用户自定义的法宝秘籍,能称得上简约而不简单。

其他亮点功能

日期、时间、节日、节气、问候模板: 可以在按键配置的地方定制引导前缀

key_binder/shijian_keys: ["/", "o"] 这样的配置以为你你可以/sj也可以osj,某些方案o有别的作用时候可以去掉o,灵活处理。

#时间:osj 或者 /sj
#日期:orq 或者 /rq
#农历:onl 或者 /nl
#星期:oxq 或者 /xq
#今年第几周:oww 或者 /ww
#节气:ojq 或者 /jq
#日期+时间:ors 或者 /rs
#时间戳:ott 或者 /tt
#大写N日期:N20250315 或者 N0302 即不添加年
#节日:ojr 或者 /jr
#问候模板:/day 或者 oday

Unicode: 大写 U 开头,如 U62fc 得到「拼」。

数字、金额大写: 大写 R 开头,如 R1234 得到「一千二百三十四、壹仟贰佰叁拾肆元整」。

/引导模式: 通过输入 /sx 快捷输入关于“数学”的特殊符号,具体能输入什么可以打开 symbols.yaml学习。

计算器: 通过输入大写V引导继续输入如:V3+5 候选框就会有8和3+5=8,基础功能 + - * / % ^ 还支持 sin(x) cos(x) 等众多运算方式 点击全面学习

自动上屏: 例如:三位、四位简码唯一时,自动上屏如jjkw岌岌可危 zmhu怎么回事 。默认未开启,方案文件中speller:字段下取消注释这两句开启 # auto_select: true # auto_select_pattern: ^[a-z]+/|^[a-df-zA-DF-Z]\w{3}|^e\w{4}

错音错字提示: 例如:输入gei yu给予,获得jǐ yǔ提示,此功能与全拼、双拼类型无关全部支持;

快符Lua: 例如通过 a/,aa/ ,快速自动上屏符号或者任意字符,值设置为repeat则意味着按下对应按键,重复上屏候选词需要说明的是使用间接辅助码用户只能享受26字母的扩展,其余用户能享受单字母、双字母 的更多扩展;

超级tips: 支持将表情、化学式、翻译、简码 提示等等你能想到得数据获得提示显示并将通过一个自定义按键直接上屏,默认为“.” 避免了占用候选框,通过Control+t 进行开关。⚠️仓输入法、超越输入法设置按键交由rime去处理,没有特殊需求应该一律交给rime;

辅助码提示(仅PRO): 任意长度候选词的辅助码提示能力,默认开启1个字的辅助码,可以在方案文件中定义更长的长度。Ctrl+a可以实时在开启辅助码提示、开启声调全拼提示、关闭注释 三个状态循环,Ctrl+c开启拆分辅助提示,优先级高于普通辅助提示;

输入码音调显示: 通过Ctrl+s可以使得输入码实时动态显示全拼并加音调,这是万象特色功能;

用户按需造词(仅PRO): 默认通过``引导的方式进入用户词自造词模式,继续输入则``前缀消失,后面打出来的字上屏后完成造词。 pro版本讲究自主可控,由于辅助码的使用在很多时候不熟悉的时候可能会上屏更加异常的词汇或者生僻字,有的用户还不会使用Esc退出输入,而是选择直接敲下空格。按需造词可以有效把控造出的词是有意义的,而且默认靠后,原因简单基本上有意义的高频词万象已经提供,你应该使用辅助码将其前置。重点:在此基础上我们还支持“后触发”当你输入编码后发现没有你要的行业词汇,此时在后面双击`` 就可以在不删除编码的情况下完成造词。还有一个是次选造词,如果次选是你想要的,并且是词库组合成的,上屏就会记录下来。

总结一下,造词功能由:①``起始的主动造词,②``在编码后面的主动造词,③次选造词。三个特性构成

用户词删除: 不管什么删除都不能直接作用于固定词典,使用Ctrl+del是rime系统删除用户词,就可以将用户词标记为c<=0,这在rime系统中就表现为不使用,假性删除,如何能真的删除这些词汇,可以通过/del输入编码来触发删除,这是一个危险操作,操作之前需要点击同步触发导出用户词的txt文件,此后我们就能放心使用,整个步骤:①先同步,②输入/del触发清理③重新部署④同步,就可以将清理后的词库恢复到db数据库中。

手动排序(Lua): ①词典候选类型:对选中的候选词操作,使用Ctrl+j向左一步,Ctrl+k向右一步,Ctrl+l(零)移除选中排序信息,Ctrl+p 置顶选中候选。其作用于当时编码与候选词;②动态生成的Lua候选,很多时候我们对日期、时间等输出格式首选有着自己的追求,复杂的配置又往往提升了使用难度,于是我们基于排序Lua实现了动态内容的按序号索引的排序,也就是说该序号下原本生成的格式整个发生了位置变化,使用方法一致。信息储存于Lua文件夹下排序数据库中sequence.userdb,支持导出导入数据便于多设备共用。

排序信息同步:

1. A 设备导出
    1. 首选确保 rime 用户目录下的 lua 目录下没有 `sequence.txt` 文件
    2. 按「部署」,会自动导出数据到 `sequence.txt` 文件
    3. 将生成的 `sequence.txt` 这个复制到 B 的相同位置

2. B 设置按「部署」导入成功。如想查看同步的结果,可以再次按下部署,查看生成的「sequence.txt」 文件

声调辅助回退(Lua): 万象是将7890用于代表1234声,轻声归并到了4,我们支持在例如输入ni9后发现我可能要4声,ni0,此时我们无需删除数字9而是直接输入对的0,类似手动在7890之间轮巡,能有效快速提升声调辅助的效率,减少使用负担,也是万象独创功能。

删除键限制(Lua): 可以在输入中当持续按下删除编码为0时会卡住,抬起重新按下才能继续删除已经上屏内容,避免误删除上屏内容。目前仅PC可用,也是万象独创功能。

输入长度限制(Lua): 对两类场景进行限制,避免数据并发卡顿:1、重复输入8个连续相同的字母,aaaaaaaa会提示:已超最大重复声母。因为连续多个的重复字母会造成严重的卡顿;2、分词片段限制在30个,也就是30个字,过长的语句价值不大还会造成卡顿。

Tab循环切换音节: 当输入多个字词时想要给前面补充辅助码,可以多次按下tab循环切换,这种可能比那些复杂的快捷键好用一些;

翻译模式: 输入状态按下Ctrl+E快捷键进入翻译模式,原理是opencc查表进行中英文互译,能否翻译取决于词表的丰富度;

字符集过滤: 默认开启过滤,写在charset.dict.yaml的就是可以通过的字表,默认为8105+𰻞𰻞,如果你想什么字在小字集模式可以通过可以写在这里,配套开关【小字集、大字集】,快捷键Ctrl+g

自定义词库: 自定义词库首先要利用LMDG中的脚本将你自己的词库刷成与万象同类型的声调、或者声调+辅助码的形态,因为主词库要参与转写。对于custom_phrase则需要手动编辑编码为实际输入的编码

pay

鸣谢

  • 感谢网友的热情提报问题,使得模型和词库体验进一步提升。

赞赏

如果觉得项目好用,可以请AMZ喝咖啡

pay

For Tasks:

Click tags to check more tools for each tasks

For Jobs:

Alternative AI tools for rime_wanxiang

Similar Open Source Tools

For similar tasks

For similar jobs