Stars
An open-source AI agent that brings the power of Gemini directly into your terminal.
Interactive User Feedback MCP
ripgrep recursively searches directories for a regex pattern while respecting your gitignore
A generative speech model for daily dialogue.
A screen-sharing / remote collaboration software written in Rust
CLUENER2020 中文细粒度命名实体识别 Fine Grained Named Entity Recognition
Chinese NER(Named Entity Recognition) using BERT(Softmax, CRF, Span)
Language Understanding Evaluation benchmark for Chinese: datasets, baselines, pre-trained models,corpus and leaderboard
Chinese Named Entity Recognition with IDCNN/biLSTM+CRF, and Relation Extraction with biGRU+2ATT 中文实体识别与关系提取
中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法
Large-scale Pre-training Corpus for Chinese 100G 中文预训练语料
An implement of the paper of EDA for Chinese corpus.中文语料的EDA数据增强工具。NLP数据增强。论文阅读笔记。
Chinese NER using Lattice LSTM. Code for ACL 2018 paper.
xmnlp:提供中文分词, 词性标注, 命名体识别,情感分析,文本纠错,文本转拼音,文本摘要,偏旁部首,句子表征及文本相似度计算等功能
此项目完成了关于 NLP-Beginner:自然语言处理入门练习 的所有任务,所有代码都经过测试,可以正常运行。
[COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集
中文文本分类,TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention,DPCNN,Transformer,基于pytorch,开箱即用。
搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。
基于Pytorch的Bert应用,包括命名实体识别、情感分析、文本分类以及文本相似度等
多标签文本分类,多标签分类,文本分类, multi-label, classifier, text classification, BERT, seq2seq,attention, multi-label-classification
机器学习、深度学习、自然语言处理、计算机视觉、各种算法等AI领域相关技术的路线、教程、干货分享。笔记有:机器学习实战、剑指Offer、cs231n、cs131、吴恩达机器学习、cs224n、python自然语言处理实战
Ling is a MoE LLM provided and open-sourced by InclusionAI.
中文文本分类任务,基于PyTorch实现(TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention, DPCNN, Transformer,Bert,ERNIE),开箱即用!