pyspark. Spark 最主要的抽象概念就是一个叫做Dataset 的分布式数据集。Dataset 可以从Hadoop InputFormats(例如HDFS 文件)创建或者由其他Dataset 转换而来。
確定! 回上一頁