Stars
越来越多的网站具有反爬虫特性,有的用图片隐藏关键数据,有的使用反人类的验证码,建立反反爬虫的代码仓库,通过与不同特性的网站做斗争(无恶意)提高技术。(欢迎提交难以采集的网站)(因工作原因,项目暂停)
A series of convenience functions to make basic image processing operations such as translation, rotation, resizing, skeletonization, and displaying Matplotlib images easier with OpenCV and Python.
中文古诗自动作诗机器人,x炸天,基于tensorflow1.10 api,正在积极维护升级中,快star,保持更新!
Module for automatic summarization of text documents and HTML pages.
Keras Attention Layer (Luong and Bahdanau scores).
各种nlp 框架(自然语言处理)集成以及使用包括 word2vec nltk textblob crf++ 等
一个基于最新版本TensorFlow的Char RNN实现。可以实现生成英文、写诗、歌词、小说、生成代码、生成日文等功能。
Keras implementation of Tensorflow's Wide and Deep Algorithm
Implement character-level language models for text generation based-on LSTM, in Python/TensorFlow
新闻检索:爬虫定向采集3-4个网页,实现网页信息的抽取、检索和索引。网页个数不少于10个,能按时间、相关度、热度等属性进行排序,并实现相似主题的自动聚类。可以实现:有相关搜索推荐、snippet生成、结果预览(鼠标移到相关结果, 能预览)功能
NLPCC2017示例代码以及数据描述
Recurrent Neural Networks(GRU) for character-level language models on Chinese, in Python/Theano