如何制作一个伟大的R可重复示例

在与同事讨论绩效、教学、发送错误报告或搜索邮件列表和Stack Overflow上的指导时，经常会询问一个可重复的示例，并且总是很有用。

你有什么建议来创建一个优秀的例子？如何以文本格式粘贴r中的数据结构？您还应包括哪些其他信息？

除了使用dput（）、dump（）或structure（）之外，还有其他技巧吗？什么时候应该包含library（）或require（）语句？除了c、df、data等之外，应该避免哪些保留字。？

如何做出一个伟大的、可重复的例子？

当前回答

就我个人而言，我更喜欢“一”行。大致如下：

my.df <- data.frame(col1 = sample(c(1,2), 10, replace = TRUE),
        col2 = as.factor(sample(10)), col3 = letters[1:10],
        col4 = sample(c(TRUE, FALSE), 10, replace = TRUE))
my.list <- list(list1 = my.df, list2 = my.df[3], list3 = letters)

数据结构应该模仿作者问题的想法，而不是准确的逐字结构。当变量不覆盖我自己的变量或函数（如df）时，我真的很感激。

或者，你可以切几个角，指向一个预先存在的数据集，比如：

library(vegan)
data(varespec)
ord <- metaMDS(varespec)

不要忘记提及您可能使用的任何特殊软件包。

如果你想在更大的物体上演示一些东西，你可以尝试

my.df2 <- data.frame(a = sample(10e6), b = sample(letters, 10e6, replace = TRUE))

如果通过光栅包处理空间数据，则可以生成一些随机数据。在包装小插曲中可以找到很多例子，但这里有一个小亮点。

library(raster)
r1 <- r2 <- r3 <- raster(nrow=10, ncol=10)
values(r1) <- runif(ncell(r1))
values(r2) <- runif(ncell(r2))
values(r3) <- runif(ncell(r3))
s <- stack(r1, r2, r3)

如果您需要一些在sp中实现的空间对象，可以通过“空间”包中的外部文件（如ESRI shapefile）获取一些数据集（请参见任务视图中的空间视图）。

library(rgdal)
ogrDrivers()
dsn <- system.file("vectors", package = "rgdal")[1]
ogrListLayers(dsn)
ogrInfo(dsn=dsn, layer="cities")
cities <- readOGR(dsn=dsn, layer="cities")

2011-05-11 11:22:15

其他回答

这是一个很好的指南。

最重要的一点是：制作一小段代码，我们可以运行它来了解问题所在。一个有用的函数是dput（），但是如果您有非常大的数据，那么您可能需要制作一个小样本数据集，或者只使用前10行左右。

编辑：

此外，确保您确定了问题所在。示例不应该是一个完整的R脚本，其中包含“在第200行出现错误”。如果您使用R（我爱浏览器（））和Google中的调试工具，那么您应该能够真正确定问题所在，并重现一个同样错误的小例子。

2011-05-11 11:21:24

使用testthat包中的函数来显示预期发生的情况是一个好主意。因此，其他人可以更改您的代码，直到它运行无误。这减轻了那些想帮助你的人的负担，因为这意味着他们不必解码你的文本描述。例如

library(testthat)
# code defining x and y
if (y >= 10) {
    expect_equal(x, 1.23)
} else {
    expect_equal(x, 3.21)
}

这比“我认为如果y等于或超过10，x将为1.23，否则为3.21，但我都没有得到结果”更清楚。即使在这个愚蠢的例子中，我认为代码比单词更清楚。使用testthat可以让你的助手专注于代码，这节省了时间，并且可以让他们在发布问题之前知道他们已经解决了你的问题

2017-04-04 21:08:35

通常，您需要一些数据作为示例，但是，您不想发布确切的数据。要在已建立的库中使用一些现有的data.frame，请使用data命令导入它。

例如。，

data(mtcars)

然后解决问题

names(mtcars)
your problem demostrated on the mtcars data set

2013-02-22 15:29:33

我有一个非常简单和有效的方法来制作上面没有提到的R示例。你可以先定义你的结构。例如

mydata <- data.frame(a=character(0), b=numeric(0),  c=numeric(0), d=numeric(0))

>fix(mydata)

然后您可以手动输入数据。这对于较小的示例而不是较大的示例是有效的。

2014-02-20 09:11:37