如何在Spark Dataframe中显示完整的列内容?

我使用spark-csv加载数据到一个DataFrame。我想做一个简单的查询并显示内容:

val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("my.csv")
df.registerTempTable("tasks")
results = sqlContext.sql("select col from tasks");
results.show()

山坳似乎被截断了:

scala> results.show();
+--------------------+
|                 col|
+--------------------+
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:15:...|
|2015-11-06 07:15:...|
|2015-11-16 07:15:...|
|2015-11-16 07:21:...|
|2015-11-16 07:21:...|
|2015-11-16 07:21:...|
+--------------------+

如何显示列的全部内容?

结果。Show (20, false)不会截断。检查来源

20是在不带任何参数的情况下调用show()时显示的默认行数。

2015-11-16 19:24:23

如果输入results.show(false)，结果将不会被截断

2016-04-08 19:02:03

试试这个命令:

df.show(df.count())

2016-11-25 20:16:32

下面的代码将有助于查看所有行，而不会截断每列

df.show(df.count(), False)

2017-02-05 01:21:24

其他的解都很好。如果这些是你的目标:

没有列的截断，没有行损失，快, 非常高效。

这两行很有用……

    df.persist
    df.show(df.count, false) // in Scala or 'False' in Python

通过持久化，当使用持久化或缓存来维护执行器内部的临时底层数据帧结构时，执行器的两个操作count和show会更快更有效。请参阅有关持久化和缓存的更多信息。

2017-02-15 06:25:17

结果。show(20, False)或结果。错误的显示(20日) 这取决于你是在Java/Scala/Python上运行它

2017-03-08 05:40:03

Results.show (false)将显示完整的列内容。

Show方法默认限制为20行，在false前添加数字将显示更多行。

2017-11-08 17:54:23

results.show(20,false)在Scala中为我做到了这一点。

2018-04-16 18:32:37

在Databricks中，您可以以表格格式可视化数据帧。使用命令:

display(results)

它看起来就像

2018-09-10 09:12:34

我使用插件Chrome扩展工作得很好:

[https://userstyles.org/styles/157357/jupyter-notebook-wide][1]

2019-05-23 17:35:44

在scala中试试这个:

df.show(df.count.toInt, false)

show方法接受一个整数和一个布尔值，但df除外。count返回Long…所以需要类型铸造

2019-12-10 01:53:37

在c#选项中("truncate"， false)不会截断输出中的数据。

StreamingQuery query = spark
                    .Sql("SELECT * FROM Messages")
                    .WriteStream()
                    .OutputMode("append")
                    .Format("console")
                    .Option("truncate", false)
                    .Start();

2020-04-01 19:37:23

以下答案适用于Spark Streaming应用程序。

通过将“truncate”选项设置为false，您可以告诉输出接收器显示完整的列。

val query = out.writeStream
          .outputMode(OutputMode.Update())
          .format("console")
          .option("truncate", false)
          .trigger(Trigger.ProcessingTime("5 seconds"))
          .start()

2020-06-10 19:55:22

在pyspark中尝试过