在Java中，确定对象大小的最佳方法是什么?

我有一个应用程序，读取一个CSV文件与成堆的数据行。我根据数据类型向用户提供了行数的摘要，但我想确保不会读入太多行数据而导致OutOfMemoryErrors。每一行转换成一个对象。有没有一种简单的方法以编程方式找出该对象的大小?是否有一个引用定义了一个VM的基本类型和对象引用有多大?

现在，我有代码说读取多达32,000行，但我还希望有代码说读取尽可能多的行，直到我使用了32MB的内存。也许这是另一个问题，但我还是想知道。

当前回答

你必须利用反射在物体上行走。做的时候要小心:

仅仅分配一个对象在JVM中就有一些开销。这个量因JVM而异，所以可以将此值作为参数。至少让它成为一个常量(8字节?)，并应用于分配的任何东西。仅仅因为一个字节理论上是1个字节，并不意味着内存中只需要一个字节。在对象引用中会有循环，因此您需要使用object-equals作为比较器来保留HashMap或类似的东西，以消除无限循环。

@jodonnell:我喜欢你的解决方案的简单性，但许多对象是不可序列化的(所以这将抛出一个异常)，字段可以是暂时的，对象可以覆盖标准方法。

2008-09-09 17:19:48

其他回答

首先，“对象的大小”在Java中并不是一个定义明确的概念。你可以指对象本身，包括它的成员、对象和它引用的所有对象(引用图)。您可以指内存中的大小或磁盘上的大小。JVM可以优化字符串之类的东西。

所以唯一正确的方法是用一个好的分析器(我使用YourKit)询问JVM，这可能不是你想要的。

然而，从上面的描述来看，似乎每一行都是自包含的，没有很大的依赖树，因此序列化方法在大多数jvm上可能是一个很好的近似方法。最简单的方法如下:

 Serializable ser;
 ByteArrayOutputStream baos = new ByteArrayOutputStream();
 ObjectOutputStream oos = new ObjectOutputStream(baos);
 oos.writeObject(ser);
 oos.close();
 return baos.size();

请记住，如果对象具有公共引用，这将不会给出正确的结果，并且序列化的大小并不总是与内存中的大小匹配，但这是一个很好的近似值。如果您将ByteArrayOutputStream大小初始化为一个合理的值，代码将会更有效。

2008-09-09 17:22:37

没有方法调用，如果这是你想要的。只要稍加研究，我想你就可以自己写了。一个特定的实例具有一个固定的大小，该大小来自引用和原语值的数量以及实例簿记数据。您可以简单地遍历对象图。行类型变化越少，越容易。

如果这太慢或者麻烦太多，总有好的老式的行计数经验法则。

2008-09-09 17:15:40

当使用JetBrains IntelliJ时，首先在|文件设置|构建，执行，部署|调试器中启用“附加内存代理”。

调试时，右键单击感兴趣的变量，选择“计算保留大小”:

2020-04-23 21:30:04

几年前，Javaworld有一篇关于确定组合和潜在嵌套Java对象大小的文章，他们基本上介绍了如何在Java中创建sizeof()实现。这种方法基本上建立在其他工作的基础上，在这些工作中，人们通过实验确定了原语和典型Java对象的大小，然后将该知识应用于递归地遍历对象图以计算总大小的方法。

它总是比原生C实现更不准确，这仅仅是因为类背后发生的事情，但它应该是一个很好的指示器。

另外一个SourceForge项目被适当地称为sizeof，它提供了一个带有sizeof()实现的Java5库。

附注:不要使用序列化方法，序列化对象的大小和它在运行时所消耗的内存量之间没有相关性。

2008-09-09 18:42:54

当我在Twitter工作时，我写了一个计算深度对象大小的实用程序。它考虑了不同的内存模型(32位，压缩oops, 64位)，填充，子类填充，在循环数据结构和数组上正确工作。你可以编译这个。java文件;它没有外部依赖:

https://github.com/twitter/commons/blob/master/src/java/com/twitter/common/objectsize/ObjectSizeCalculator.java

2015-04-09 11:07:01

在Java中，确定对象大小的最佳方法是什么?

推荐文章

最新文章

标签