中日文自然语言处理
spark 自定义数据源 通过使用spark,将指定路径下的所有文件转为Rdd[Row] schema属性包括文件名,路径,文件大小,后缀,文件内容(字节数组切分)
Spark-StructuredStreaming对mongo实现自定义流数据源
这个仓库记录日常flink开发所实现的java,scala代码,供大家学习使用
最近一年贡献:851 次
最长连续贡献:6 日
最近连续贡献:1 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。