Stars
14
stars
written in Scala
Clear filter
Apache Spark - A unified analytics engine for large-scale data processing
CMAK is a tool for managing Apache Kafka clusters
模拟电商系统上线运行一段时间后,根据收集到大量的用户行为数据,利用大数据技术(Flink)进行深入挖掘和分析,进而得到感兴趣的商业指标并增强对风险的控制。 整体可以分为用户行为习惯数据和业务行为数据两大类。用户的行为习惯数据包括了用户的登录方式、上线的时间点及时长、点击和浏览页面、页面停留时间以及页面跳转等等,从中进行流量统计和热门商品的统计,并深入挖掘用户的特征;业务行为数据分为两类:一类…
❇️ 基于SparkMLLib实现的商品推荐功能,包括:基于用户的协同过滤,基于物品的协同过滤,基于ALS交替最小二乘的协同过滤。
智能数据探索服务(Intelligent Data Exploration Service),一站式Data + AI数据解决方案!
机器学习:1)离线统计(统计数据即可),离线推荐(基于LFM隐语义模型 采用ALS算法 ,并根据最小方差计算RMSE),2)实时推荐,实时根据用户最近看过的一部电影,找到相似的电影(相似矩阵由上一个需求得出)作为候选电影,再结合最近评分的电影,推出优先级别 3)基于内容(电影)的推荐,TF-IDF算法 4) 针对冷启动问题建议打上专家标签