RDD1 = sc.parallelize([1,2,3,4]) RDD2 = sc.parallelize([6,5,4,3]) print RDD1.union(RDD2).collect() print RDD1.union(RDD2).distinct().collect()