c++中不区分大小写的字符串比较

在c++中进行不区分大小写字符串比较而不将字符串转换为全大写或全小写的最佳方法是什么?

请指出这些方法是否对unicode友好，以及它们的可移植性如何。

当前回答

假设您正在寻找一个方法，而不是一个已经存在的神奇函数，坦率地说，没有更好的方法。对于有限的字符集，我们都可以使用聪明的技巧编写代码片段，但在一天结束时，你必须转换字符。

这种转换的最佳方法是在比较之前进行转换。当涉及到编码方案时，这为您提供了很大的灵活性，而实际的比较操作符应该忽略这一点。

当然，你可以在你自己的字符串函数或类后面“隐藏”这个转换，但你仍然需要在比较之前转换字符串。

2008-08-14 20:10:37

其他回答

boost的问题在于，你必须与boost相关联并依赖于boost。在某些情况下并不容易(例如android)。

使用char_traits意味着所有的比较都是不区分大小写的，这通常不是你想要的。

这就足够了。它应该是相当有效的。它不处理unicode或任何东西。

bool iequals(const string& a, const string& b)
{
    unsigned int sz = a.size();
    if (b.size() != sz)
        return false;
    for (unsigned int i = 0; i < sz; ++i)
        if (tolower(a[i]) != tolower(b[i]))
            return false;
    return true;
}

更新:c++ 14版本(#include <算法>):

bool iequals(const string& a, const string& b)
{
    return std::equal(a.begin(), a.end(),
                      b.begin(), b.end(),
                      [](char a, char b) {
                          return tolower(a) == tolower(b);
                      });
}

c++ 20版本使用std::ranges:

#include <ranges>
#include <algorithm>
#include <string>

bool iequals(const std::string_view& lhs, const std::string_view& rhs) {
    auto to_lower{ std::ranges::views::transform(std::tolower) };
    return std::ranges::equal(lhs | to_lower, rhs | to_lower);
}

2010-11-07 21:49:17

又短又漂亮。没有其他依赖，除了扩展的std C库。

strcasecmp(str1.c_str(), str2.c_str()) == 0

如果str1和str2相等，则返回true。 Strcasecmp可能不存在，可能有类似的stricmp, strcmpi等。

示例代码:

#include <iostream>
#include <string>
#include <string.h> //For strcasecmp(). Also could be found in <mem.h>

using namespace std;

/// Simple wrapper
inline bool str_ignoreCase_cmp(std::string const& s1, std::string const& s2) {
    if(s1.length() != s2.length())
        return false;  // optimization since std::string holds length in variable.
    return strcasecmp(s1.c_str(), s2.c_str()) == 0;
}

/// Function object - comparator
struct StringCaseInsensetiveCompare {
    bool operator()(std::string const& s1, std::string const& s2) {
        if(s1.length() != s2.length())
            return false;  // optimization since std::string holds length in variable.
        return strcasecmp(s1.c_str(), s2.c_str()) == 0;
    }
    bool operator()(const char *s1, const char * s2){ 
        return strcasecmp(s1,s2)==0;
    }
};


/// Convert bool to string
inline char const* bool2str(bool b){ return b?"true":"false"; }

int main()
{
    cout<< bool2str(strcasecmp("asd","AsD")==0) <<endl;
    cout<< bool2str(strcasecmp(string{"aasd"}.c_str(),string{"AasD"}.c_str())==0) <<endl;
    StringCaseInsensetiveCompare cmp;
    cout<< bool2str(cmp("A","a")) <<endl;
    cout<< bool2str(cmp(string{"Aaaa"},string{"aaaA"})) <<endl;
    cout<< bool2str(str_ignoreCase_cmp(string{"Aaaa"},string{"aaaA"})) <<endl;
    return 0;
}

输出:

true
true
true
true
true

2016-09-30 15:51:56

你说的是一个愚蠢的不区分大小写的比较还是一个完全标准化的Unicode比较?

哑比较不会找到可能相同但二进制不相等的字符串。

例子:

U212B (ANGSTROM SIGN)
U0041 (LATIN CAPITAL LETTER A) + U030A (COMBINING RING ABOVE)
U00C5 (LATIN CAPITAL LETTER A WITH RING ABOVE).

都是等价的，但它们也有不同的二进制表示。

也就是说，Unicode标准化应该是必读的，特别是如果您计划支持韩文，Thaï和其他亚洲语言。

此外，IBM几乎为大多数优化的Unicode算法申请了专利，并将它们公开提供。它们还维护一个实现:IBM ICU

2008-08-14 20:31:35

的提振。String库有很多算法来做不区分大小写的比较等等。

您可以实现自己的，但如果已经完成了，为什么还要麻烦呢?

2010-05-22 00:57:43

对于我基本的不区分大小写的字符串比较需求，我宁愿不使用外部库，也不想要一个与所有其他字符串不兼容的不区分大小写特征的单独字符串类。

所以我想到的是:

bool icasecmp(const string& l, const string& r)
{
    return l.size() == r.size()
        && equal(l.cbegin(), l.cend(), r.cbegin(),
            [](string::value_type l1, string::value_type r1)
                { return toupper(l1) == toupper(r1); });
}

bool icasecmp(const wstring& l, const wstring& r)
{
    return l.size() == r.size()
        && equal(l.cbegin(), l.cend(), r.cbegin(),
            [](wstring::value_type l1, wstring::value_type r1)
                { return towupper(l1) == towupper(r1); });
}

一个简单的函数，一个重载char，另一个重载whar_t。不使用任何非标准的东西，所以应该在任何平台上都很好。

相等性比较不会考虑像变长编码和Unicode规范化这样的问题，但据我所知，basic_string不支持这一点，而且这通常不是一个问题。

在需要对文本进行更复杂的词典操作的情况下，您只需使用像Boost这样的第三方库，这是可以预料到的。

2013-06-26 21:29:22

c++中不区分大小写的字符串比较

推荐文章

最新文章

标签