-
mykit-db-sync Public
Forked from binghe001/mykit-db-syncmykit中分离出的强大的数据库同步工具——mykit-db-sync。 基于java开发的功能强大、配置灵活的数据库之间同步工具,和数据产生器一样,均是前段时间因为项目需要编写的小工具,在实际应用场景中,我们经常需要定期将一个数据库的数据同步到另外一个数据库中,常见的一种做法是将源数据库的数据dump为sql文件,然后到目标数据库执行sql文件完成数据库的导入,但是这种方法至少存在以下问题…
Java Apache License 2.0 UpdatedSep 11, 2018 -
-
-
CoolplaySpark Public
Forked from lw-lin/CoolplaySpark酷玩 Spark: Spark 源代码解析、Spark 类库等
Scala UpdatedFeb 25, 2018 -
utils4s Public
Forked from jacksu/utils4sscala、spark使用过程中,各种测试用例以及相关资料整理
Scala UpdatedJul 21, 2017 -
-
FreeBook Public
Forked from 80945540/FreeBook基于MVP模式开发的带缓存网络爬虫,采用最流行框架搭建,干货多多
Java UpdatedNov 16, 2016 -
housedb Public
Forked from coolcooldee/housedb房源数据爬虫。支持断点续爬,价格变更通知,提供数据的分析统计服务。
Java Apache License 2.0 UpdatedNov 16, 2016 -
SeimiCrawler Public
Forked from zhegexiaohuozi/SeimiCrawler一个敏捷的,分布式的爬虫框架;An agile, distributed crawler framework.
Java Apache License 2.0 UpdatedNov 10, 2016 -
gecco Public
Forked from xtuhcy/geccoEasy to use lightweight web crawler(易用的轻量化网络爬虫)
Java MIT License UpdatedNov 3, 2016 -
WebCollector Public
Forked from CrawlScript/WebCollectorWebCollector is an open source web crawler framework based on Java.It provides some simple interfaces for crawling the Web,you can setup a multi-threaded web crawler in less than 5 minutes.
Java UpdatedOct 22, 2016 -
dubbox Public
Forked from dangdangdotcom/dubboxDubbox now means Dubbo eXtensions, and it adds features like RESTful remoting, Kyro/FST serialization, etc to the Dubbo service framework.
Java Apache License 2.0 UpdatedOct 8, 2016 -
JSONUtil Public
Forked from billdavidson/JSONUtilJSON generation and parsing utility library for Java.
Java UpdatedOct 5, 2016 -
UniPinyin Public
Forked from nillith/UniPinyinJava 汉语拼音查询工具。支持CJK基本字符集及扩充区A的中文汉字,共26679个,其中多音字6769个。
Java Apache License 2.0 UpdatedAug 8, 2016 -
-
-
-
-
ExcelUtil Public
Forked from SargerasWang/ExcelUtil用于导入导出Excel的Util包,基于Java的POI。可将List<Bean>导出成Excel,或读取Excel成List<Bean>,读取时有验证和Log。
Java UpdatedMar 12, 2016 -
-
-
-
-
Export Public
Forked from hy-wux/Export数据的导出(支持DB2、MySQL、Oracle、Teradata数据库的数据导出)、合并(支持将多个小数据文件合并成一个大的数据文件)、传输(支持FTP、SFTP数据传输)程序,适用于向指定FTP服务器供数的情况,常见于多个源系统以数据文件的形式向数据仓库集中供数。该程序目前已在某农村信用社数据仓库项目中投入使用。
Java Apache License 2.0 UpdatedJun 24, 2015 -
weibo-spider Public
Forked from yuki-lau/weibo-spider新浪微博爬虫,采用Java语言开发,基于HTTPClient 4.0,采用MySQL存储爬取数据,支持多进程并发执行。功能包括:爬取微博、评论、转发、关注列表(层次)。根据数据需求,持续更新...
Java UpdatedFeb 27, 2014 -
spider Public
Forked from matuobasyouca/spidera simple distributed spider in Java. Java编写的一个简单分布式爬虫
Java UpdatedJun 18, 2013