个人开发的 AI Agent Skills 集合。
name-marked — 中文姓名属性识别(v1.0.0)
基于贝叶斯算法,从中文姓名中预测性别、出生年代、星座、四季、节气。
- 对应项目:name_marked
- 性别准确率 86.2%,年代准确率 76.3%
- 支持繁简体自动转换、批量处理
dict-seg — 批量中文分词与词频统计(v1.3.0)
基于 jieba 的批量分词+词频统计,支持词性标注、自定义词典、预分词、词频合并。
- 对应项目:dict_seg
- 支持 20GB 多行/10GB 单行/200GB 文件夹
- 三阶段流水线:并行分词 → 归并排序 → 过滤输出
- 新增:
--user-dict自定义词典、--pre-seg预分词模式、dict-seg-merge词频合并
dict-build — 中文新词发现与词典构建(v1.2.0)
自动发现中文新词,基于互信息、左右熵、位置成词概率判定成词。
- 对应项目:dict_build_py
- 基于 dict_build (Java) 用 Python 重构
- 支持 UTF-8/GBK/GB18030/BIG5 五步编码检测
- 自动适配大文件/多文件/单行超大文件/超大 n-gram
将 .skill 文件安装到 Agent 的 skills 目录,或将整个仓库作为 skills 工作区使用。