Starred repositories
该软件是antiplag查重软件的web版后端,能对代码(java、c、c++、python等)、文档(txt、doc、docx、pdf等)之间的相似度进行 基于字符和语义(GST、BM25、semhash)的比较分析,输出相似度高的代码、文本,进而辅助发现学生之间互相抄袭的行为。
Fast Multimodal Semantic Deduplication & Filtering
作业查重软件,它实现了程序代码、文档文本、图片之间的相似度检查。a code-similarity, text-similarity and image-similarity computation software for the codes, documents and images of assignment.
🌴A simple & beautiful blogging system implemented with spring-boot & thymeleaf & mybatis My Blog 是由 SpringBoot + Mybatis + Thymeleaf 等技术实现的 Java 博客系统,页面美观、功能齐全、部署简单及完善的代码,一定会给使用者无与伦比的体验
State-of-the-art 2D and 3D Face Analysis Project
Approximate Nearest Neighbors in C++/Python optimized for memory usage and loading/saving to disk
AKShare is an elegant and simple financial data interface library for Python, built for human beings! 开源财经数据接口库
A Python library for anomaly detection across tabular, time series, graph, text, and image data. 60+ detectors, benchmark-backed ADEngine orchestration, and an agentic workflow for AI agents.
State of the Art Natural Language Processing
self complement of Sentence Similarity compute based on cilin, hownet, simhash, wordvector,vsm models,基于同义词词林,知网,指纹,字词向量,向量空间模型的句子相似度计算。
中文长文本分类、短句子分类、多标签分类、两句子相似度(Chinese Text Classification of Keras NLP, multi-label classify, or sentence classify, long or short),字词句向量嵌入层(embeddings)和网络层(graph)构建基类,FastText,TextCNN,CharCNN,TextRNN,…
Web app for Scrapyd cluster management, Scrapy log analysis & visualization, Auto packaging, Timer tasks, Monitor & Alert, and Mobile UI. Docs 文档 👉
Perceptual image hashing library used to match similar images
A syntax highlighting, code folding text editor for Java Swing applications.
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
moss implementation in python - checks software codes for plagiarism
mall项目是一套电商系统,包括前台商城系统及后台管理系统,基于Spring Boot+MyBatis实现,采用Docker容器化部署。 前台商城系统包含首页门户、商品推荐、商品搜索、商品展示、购物车、订单流程、会员中心、客户服务、帮助中心等模块。 后台管理系统包含商品管理、订单管理、会员管理、促销管理、运营管理、内容管理、统计报表、财务管理、权限管理、设置等模块。
State-of-the-Art Source Code Plagiarism & Collusion Detection. Check for plagiarism in a set of programs.
一个实际场景下的中文车牌识别软件 the chinese license plate recognition software in unconstrained environment
使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现,爬虫状态显示使用graphite实现