float和double的区别是什么?

我读过关于双精度和单精度之间的区别。然而，在大多数情况下，float和double似乎是可互换的，即使用其中一个似乎不会影响结果。事实真的如此吗?什么时候浮点数和双精度数可以互换?它们之间有什么区别?

当前回答

如果使用嵌入式处理，最终底层硬件(例如FPGA或某些特定的处理器/微控制器模型)将在硬件中优化实现float，而double将使用软件例程。因此，如果浮点数的精度足以满足需求，则使用浮点数执行程序的速度将比使用浮点数执行程序的速度快几倍。正如在其他答案中提到的，要小心累积错误。

2020-05-07 13:36:32

其他回答

有三种浮点类型:

浮动双长两倍

一个简单的维恩图可以解释: 类型值的集合

2020-09-07 08:48:54

以下是标准C99 (ISO-IEC 9899 6.2.5§10)或c++ 2003 (ISO-IEC 14882-2003 3.1.9§8)标准所说的:

浮点数有三种类型:浮点数、双精度浮点数和长双精度浮点数。double类型提供的精度至少与float类型相同，long double类型提供的精度至少与double类型相同。float类型的值集是double类型值集的子集;double类型的值集是long double类型值集的子集。

c++标准增加了:

浮点类型的值表示是由实现定义的。

我建议你看一看优秀的《每个计算机科学家都应该知道浮点算术》，它深入介绍了IEEE浮点标准。您将了解表示细节，并将意识到在量级和精度之间存在权衡。浮点表示的精度随着幅度的减小而增加，因此-1到1之间的浮点数具有最高的精度。

2010-03-05 12:54:51

浮点数的精度比双精度数低。虽然你已经知道了，但为了更好地理解，请阅读《关于浮点算术我们应该知道什么》。

2010-03-05 12:54:45

给定二次方程:x2−4.0000000 x + 3.9999999 = 0, 10位有效数字的精确根为:r1 = 2.000316228, r2 = 1.999683772。

使用float和double，我们可以编写一个测试程序:

#include <stdio.h>
#include <math.h>

void dbl_solve(double a, double b, double c)
{
    double d = b*b - 4.0*a*c;
    double sd = sqrt(d);
    double r1 = (-b + sd) / (2.0*a);
    double r2 = (-b - sd) / (2.0*a);
    printf("%.5f\t%.5f\n", r1, r2);
}

void flt_solve(float a, float b, float c)
{
    float d = b*b - 4.0f*a*c;
    float sd = sqrtf(d);
    float r1 = (-b + sd) / (2.0f*a);
    float r2 = (-b - sd) / (2.0f*a);
    printf("%.5f\t%.5f\n", r1, r2);
}   

int main(void)
{
    float fa = 1.0f;
    float fb = -4.0000000f;
    float fc = 3.9999999f;
    double da = 1.0;
    double db = -4.0000000;
    double dc = 3.9999999;
    flt_solve(fa, fb, fc);
    dbl_solve(da, db, dc);
    return 0;
}

运行程序得到:

2.00000 2.00000
2.00032 1.99968

注意，这些数字并不大，但是使用float仍然可以得到抵消效果。

(事实上，上面的方法并不是用单精度浮点数或双精度浮点数求解二次方程的最佳方法，但即使使用更稳定的方法，答案也不会改变。)

2010-03-05 17:57:25

浮点计算中涉及的数字的大小并不是最相关的事情。相关的是正在进行的计算。

从本质上讲，如果您正在执行计算，而结果是一个无理数或循环小数，那么当将该数字压缩到您正在使用的有限大小的数据结构中时，将会出现舍入错误。因为double是float大小的两倍，所以舍入误差会小很多。

测试可能特别使用可能导致这种错误的数字，因此测试您是否在代码中使用了适当的类型。

2010-03-05 13:05:56

float和double的区别是什么?

推荐文章

最新文章

标签