C言語のstrcmp/strncmp関数と自作関数で文字列を比較する方法を教えて!
こういった悩みにお答えします.
本記事の信頼性
- リアルタイムシステムの研究歴12年.
- 東大教員の時に,英語でOS(Linuxカーネル)の授業.
- 2012年9月~2013年8月にアメリカのノースカロライナ大学チャペルヒル校(UNC)コンピュータサイエンス学部で客員研究員として勤務.C言語でリアルタイムLinuxの研究開発.
- プログラミング歴15年以上,習得している言語: C/C++,Python,Solidity/Vyper,Java,Ruby,Go,Rust,D,HTML/CSS/JS/PHP,MATLAB,Verse(UEFN), Assembler (x64,aarch64).
- 東大教員の時に,C++言語で開発した「LLVMコンパイラの拡張」,C言語で開発した独自のリアルタイムOS「Mcube Kernel」をGitHubにオープンソースとして公開.
- 2020年1月~現在はアメリカのノースカロライナ州チャペルヒルにあるGuarantee Happiness LLCのCTOとしてECサイト開発やWeb/SNSマーケティングの業務.2022年6月~現在はアメリカのノースカロライナ州チャペルヒルにあるJapanese Tar Heel, Inc.のCEO兼CTO.
- 最近は自然言語処理AIとイーサリアムに関する有益な情報発信に従事.
- (AI全般を含む)自然言語処理AIの論文の日本語訳や,AIチャットボット(ChatGPT,Auto-GPT,Gemini(旧Bard)など)の記事を50本以上執筆.アメリカのサンフランシスコ(広義のシリコンバレー)の会社でプロンプトエンジニア・マネージャー・Quality Assurance(QA)の業務委託の経験あり.
- (スマートコントラクトのプログラミングを含む)イーサリアムや仮想通貨全般の記事を200本以上執筆.イギリスのロンドンの会社で仮想通貨の英語の記事を日本語に翻訳する業務委託の経験あり.
こういった私から学べます.
C言語を独学で習得することは難しいです.
私にC言語の無料相談をしたいあなたは,公式LINE「ChishiroのC言語」の友だち追加をお願い致します.
私のキャパシティもあり,一定数に達したら終了しますので,今すぐ追加しましょう!
独学が難しいあなたは,元東大教員がおすすめするC言語を学べるオンラインプログラミングスクール5社で自分に合うスクールを見つけましょう.後悔はさせません!
目次
C言語で文字列の比較
C言語で文字列を比較する時は,Java言語やPython言語のように==演算子を使えません.
どうすればよいのかというと,標準ライブラリstring.hファイル内でプロトタイプ宣言されているstrcmp/strncmp関数を使います.
本記事では,strcmp/strncmp関数を含む以下の関数を紹介しますので,各々の関数の違いを学びましょう.
- strcmp/strncmp関数
- memcmp関数
- strcasecmp/strncasecmp関数
strcmp/strncmp関数
1 2 |
int strcmp(const char *s1, const char *s2); int strncmp(const char *s1, const char *s2, size_t n); |
strcmp/strncmp関数は,2つの文字列を比較します.
strcmp関数は,文字列s1と文字列s2を1文字ずつASCIIコードの値で比較します.
strcmp関数の返り値は以下になります.
- 正の値:s1がs2より大きい場合
- 0:s1とs2が等しい場合
- 負の値:s1がs2より小さい場合
strncmp関数は,s1とs2の最初のnバイトを比較する以外は,strcmp関数と同様です.
strcmp/strncmp関数の利用例
strcmp/strncmp関数の利用例を紹介します.
以下のコードは,10~13行目に定義した文字列をstrcmp/strncmp関数で比較します.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> int main(void) { char *s1 = "abc"; char *s2 = "abcde"; char *s3 = "ab"; char *s4 = "abc"; printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s2, strcmp(s1, s2)); printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s3, strcmp(s1, s3)); printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s4, strcmp(s1, s4)); printf("strcmp(\"%s\", \"%s\") = %d\n", s2, s3, strcmp(s2, s3)); printf("strcmp(\"%s\", \"%s\") = %d\n", s2, s4, strcmp(s2, s4)); printf("strcmp(\"%s\", \"%s\") = %d\n", s3, s4, strcmp(s3, s4)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, strncmp(s1, s2, 3)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, strncmp(s1, s2, 5)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 3, strncmp(s1, s3, 3)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 2, strncmp(s1, s3, 2)); return 0; } |
実行結果は以下になります.
処理系によってstrcmp/strncmp関数の返り値は異なる場合がありますが,正負かどうかは同じになります.
1 2 3 4 5 6 7 8 9 10 11 12 |
$ gcc strcmp.c $ a.out strcmp("abc", "abcde") = -100 strcmp("abc", "ab") = 99 strcmp("abc", "abc") = 0 strcmp("abcde", "ab") = 99 strcmp("abcde", "abc") = 100 strcmp("ab", "abc") = -99 strncmp("abc", "abcde", 3) = 0 strncmp("abc", "abcde", 5) = -100 strncmp("abc", "ab", 3) = 99 strncmp("abc", "ab", 2) = 0 |
strcmp/strncmp関数の注意点
strcmp/strncmp関数の利用の注意点を説明します.
以下の2つの文字列を比較する場合,異なる文字列であることはあなたは明らかですが,strcmp/strncmp関数を利用するとどうなるか確認してみましょう.
- "abc\0d"
- "abc\0ef"
以下のコードで,文字列"abc\0d"と"abc\0ef"をstrcmp/strncmp関数で比較します.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> int main(void) { char *s1 = "abc\0d"; char *s2 = "abc\0ef"; printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s2, strcmp(s1, s2)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, strncmp(s1, s2, 3)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, strncmp(s1, s2, 5)); return 0; } |
実行結果は以下になります.
1 2 3 4 5 |
$ gcc strcmp2.c $ a.out strcmp("abc", "abc") = 0 strncmp("abc", "abc", 3) = 0 strncmp("abc", "abc", 5) = 0 |
strcmp/strncmp関数の返り値が全て0なので,同じ文字列と判定しました.
この理由は,C言語では文字列の最後は'\0'文字(NULL文字,char型の1バイトの0)で終わるというルールがあるからです.
C言語の文字列のルールでは,"abc\0d"と"abc\0ef"は両方とも同じ文字列"abc"と認識することに注意して下さい.
また,printf関数の文字列のフォーマット指定子%sでは,両方とも"abc"を出力します.
strcmp/strncmp関数の自作
strcmp/strncmp関数を自作したmystrcmp/mystrncmp関数は,以下のコードになります.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <stdbool.h> int mystrcmp(const char *s1, const char *s2) { int res; while (true) { if ((res = *s1 - *s2++) != 0 || !*s1++) { break; } } return res; } int mystrncmp(const char *s1, const char *s2, size_t n) { signed char res = 0; while (n) { if ((res = *s1 - *s2++) != 0 || !*s1++) { break; } n--; } return res; } int main(void) { char *s1 = "abc"; char *s2 = "abcde"; char *s3 = "ab"; char *s4 = "abc"; printf("mystrcmp(\"%s\", \"%s\") = %d\n", s1, s2, mystrcmp(s1, s2)); printf("mystrcmp(\"%s\", \"%s\") = %d\n", s1, s3, mystrcmp(s1, s3)); printf("mystrcmp(\"%s\", \"%s\") = %d\n", s1, s4, mystrcmp(s1, s4)); printf("mystrcmp(\"%s\", \"%s\") = %d\n", s2, s3, mystrcmp(s2, s3)); printf("mystrcmp(\"%s\", \"%s\") = %d\n", s2, s4, mystrcmp(s2, s4)); printf("mystrcmp(\"%s\", \"%s\") = %d\n", s3, s4, mystrcmp(s3, s4)); printf("mystrncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, mystrncmp(s1, s2, 3)); printf("mystrncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, mystrncmp(s1, s2, 5)); printf("mystrncmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 3, mystrncmp(s1, s3, 3)); printf("mystrncmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 2, mystrncmp(s1, s3, 2)); return 0; } |
実行すると,mystrcmp/mystrncmp関数はstrcmp/strncmp関数と同じ結果になることがわかります.
1 2 3 4 5 6 7 8 9 10 11 12 |
$ gcc mystrcmp.c $ a.out mystrcmp("abc", "abcde") = -100 mystrcmp("abc", "ab") = 99 mystrcmp("abc", "abc") = 0 mystrcmp("abcde", "ab") = 99 mystrcmp("abcde", "abc") = 100 mystrcmp("ab", "abc") = -99 mystrncmp("abc", "abcde", 3) = 0 mystrncmp("abc", "abcde", 5) = -100 mystrncmp("abc", "ab", 3) = 99 mystrncmp("abc", "ab", 2) = 0 |
memcmp関数
1 |
int memcmp(const void *s1, const void *s2, size_t n); |
memcmp関数はメモリ領域 s1とs2の最初のnバイトを比較します(各々のバイトはunsigned charとして解釈).
memcmp関数の返り値は以下になります.
- 正の値:s1がs2より大きい場合
- 0:s1とs2が等しい場合
- 負の値:s1がs2より小さい場合
memcmp関数は,strcmp/strncmp関数と異なり,"abc"と"abc\0de"を異なるデータとして認識します.
memcmp関数の利用例
memcmp関数の利用例とstrcmp/strncmp関数との違いを,以下のコードで説明します.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> int main(void) { char *s1 = "abc\0d"; char *s2 = "abc\0ef"; printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s2, strcmp(s1, s2)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, strncmp(s1, s2, 3)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, strncmp(s1, s2, 5)); printf("memcmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, memcmp(s1, s2, 3)); printf("memcmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, memcmp(s1, s2, 5)); return 0; } |
実行結果は以下になります.
7行目のmemcmp関数の返り値が-1なので,異なるデータとして認識していることがわかります.
1 2 3 4 5 6 7 |
$ gcc memcmp.c $ a.out strcmp("abc", "abc") = 0 strncmp("abc", "abc", 3) = 0 strncmp("abc", "abc", 5) = 0 memcmp("abc", "abc", 3) = 0 memcmp("abc", "abc", 5) = -1 |
memcmp関数の自作
memcmp関数を自作したmymemcmp関数は,以下のコードになります.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> int mymemcmp(const void *s1, const void *s2, size_t n) { const unsigned char *su1 = (unsigned char *) s1, *su2 = (unsigned char *) s2; int res = 0; while (n-- > 0) { if ((res = *su1++ - *su2++) != 0) { break; } } return res; } int main(void) { char *s1 = "abc\0d"; char *s2 = "abc\0ef"; printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s2, strcmp(s1, s2)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, strncmp(s1, s2, 3)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, strncmp(s1, s2, 5)); printf("mymemcmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, mymemcmp(s1, s2, 3)); printf("mymemcmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, mymemcmp(s1, s2, 5)); return 0; } |
実行結果は以下になります.
1 2 3 4 5 6 7 |
$ gcc mymemcmp.c $ a.out strcmp("abc", "abc") = 0 strncmp("abc", "abc", 3) = 0 strncmp("abc", "abc", 5) = 0 mymemcmp("abc", "abc", 3) = 0 mymemcmp("abc", "abc", 5) = -1 |
strcasecmp/strncasecmp関数
1 2 |
int strcasecmp(const char *s1, const char *s2); int strncasecmp(const char *s1, const char *s2, size_t n); |
strcasecmp/strncasecmp関数は,2つの文字列s1とs2を大文字と小文字を区別せずに比較します.
strcasecmp/strncasecmp関数の返り値は以下になります.
- 正の値:s1がs2より大きい場合
- 0:s1とs2が等しい場合
- 負の値:s1がs2より小さい場合
strcasecmp/strncasecmp関数は,strcmp/strncmp関数とは異なり,"abc"と"ABC"を同じ文字列と認識します.
strcasecmp/strncasecmp関数の利用例
strcasecmp/strncasecmp関数の利用例は,strcmp/strncmp関数で紹介したコードstrcmp.cをベースに変更しています.
変更点は,以下になります.
- 変数s3とs4に代入する文字列を,それぞれ大文字の文字列"AB"と"ABC"に変更(12~13行目)
- strcasecmp/strncasecmp関数の呼び出し(27~41行目)
また,違いを比較するため,strcmp/strncmp関数の呼び出し(15~25行目)を残しています.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> int main(void) { char *s1 = "abc"; char *s2 = "abcde"; char *s3 = "AB"; char *s4 = "ABC"; printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s2, strcmp(s1, s2)); printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s3, strcmp(s1, s3)); printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s4, strcmp(s1, s4)); printf("strcmp(\"%s\", \"%s\") = %d\n", s2, s3, strcmp(s2, s3)); printf("strcmp(\"%s\", \"%s\") = %d\n", s2, s4, strcmp(s2, s4)); printf("strcmp(\"%s\", \"%s\") = %d\n", s3, s4, strcmp(s3, s4)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, strncmp(s1, s2, 3)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, strncmp(s1, s2, 5)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 3, strncmp(s1, s3, 3)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 2, strncmp(s1, s3, 2)); printf("strcasecmp(\"%s\", \"%s\") = %d\n", s1, s2, strcasecmp(s1, s2)); printf("strcasecmp(\"%s\", \"%s\") = %d\n", s1, s3, strcasecmp(s1, s3)); printf("strcasecmp(\"%s\", \"%s\") = %d\n", s1, s4, strcasecmp(s1, s4)); printf("strcasecmp(\"%s\", \"%s\") = %d\n", s2, s3, strcasecmp(s2, s3)); printf("strcasecmp(\"%s\", \"%s\") = %d\n", s2, s4, strcasecmp(s2, s4)); printf("strcasecmp(\"%s\", \"%s\") = %d\n", s3, s4, strcasecmp(s3, s4)); printf("strncasecmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, strncasecmp(s1, s2, 3)); printf("strncasecmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, strncasecmp(s1, s2, 5)); printf("strncasecmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 3, strncasecmp(s1, s3, 3)); printf("strncasecmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 2, strncasecmp(s1, s3, 2)); return 0; } |
実行結果は以下になります.
strcasecmp/strncasecmp関数は文字列を大文字と小文字を区別せずに比較できていることがわかります(15行目と22行目).
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
$ gcc strcasecmp.c $ a.out strcmp("abc", "abcde") = -100 strcmp("abc", "AB") = 32 strcmp("abc", "ABC") = 32 strcmp("abcde", "AB") = 32 strcmp("abcde", "ABC") = 32 strcmp("AB", "ABC") = -67 strncmp("abc", "abcde", 3) = 0 strncmp("abc", "abcde", 5) = -100 strncmp("abc", "AB", 3) = 32 strncmp("abc", "AB", 2) = 32 strcasecmp("abc", "abcde") = -100 strcasecmp("abc", "AB") = 99 strcasecmp("abc", "ABC") = 0 strcasecmp("abcde", "AB") = 99 strcasecmp("abcde", "ABC") = 100 strcasecmp("AB", "ABC") = -99 strncasecmp("abc", "abcde", 3) = 0 strncasecmp("abc", "abcde", 5) = -100 strncasecmp("abc", "AB", 3) = 99 strncasecmp("abc", "AB", 2) = 0 |
strcasecmp/strncasecmp関数の自作
strcasecmp/strncasecmp関数を自作したmystrcasecmp/mystrncasecmp関数は,以下のコードになります.
mystrcasecmp/mystrncasecmp関数(17~27行目,29~58行目)を実装するために,大文字を小文字に変換するmytolower関数を実装しています(8~15行目).
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> static inline unsigned char mytolower(unsigned char c) { if (c >= 'A' && c <= 'Z') { c -= 'A' - 'a'; } return c; } int mystrcasecmp(const char *s1, const char *s2) { int c1, c2; do { c1 = mytolower(*s1++); c2 = mytolower(*s2++); } while (c1 == c2 && c1 != 0); return c1 - c2; } int mystrncasecmp(const char *s1, const char *s2, size_t n) { unsigned char c1, c2; if (!n) { return 0; } do { c1 = *s1++; c2 = *s2++; if (!c1 || !c2) { break; } if (c1 == c2) { continue; } c1 = mytolower(c1); c2 = mytolower(c2); if (c1 != c2) { break; } } while (--n); return (int) c1 - (int) c2; } int main(void) { char *s1 = "abc"; char *s2 = "abcde"; char *s3 = "AB"; char *s4 = "ABC"; printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s2, strcmp(s1, s2)); printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s3, strcmp(s1, s3)); printf("strcmp(\"%s\", \"%s\") = %d\n", s1, s4, strcmp(s1, s4)); printf("strcmp(\"%s\", \"%s\") = %d\n", s2, s3, strcmp(s2, s3)); printf("strcmp(\"%s\", \"%s\") = %d\n", s2, s4, strcmp(s2, s4)); printf("strcmp(\"%s\", \"%s\") = %d\n", s3, s4, strcmp(s3, s4)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, strncmp(s1, s2, 3)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, strncmp(s1, s2, 5)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 3, strncmp(s1, s3, 3)); printf("strncmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 2, strncmp(s1, s3, 2)); printf("mystrcasecmp(\"%s\", \"%s\") = %d\n", s1, s2, mystrcasecmp(s1, s2)); printf("mystrcasecmp(\"%s\", \"%s\") = %d\n", s1, s3, mystrcasecmp(s1, s3)); printf("mystrcasecmp(\"%s\", \"%s\") = %d\n", s1, s4, mystrcasecmp(s1, s4)); printf("mystrcasecmp(\"%s\", \"%s\") = %d\n", s2, s3, mystrcasecmp(s2, s3)); printf("mystrcasecmp(\"%s\", \"%s\") = %d\n", s2, s4, mystrcasecmp(s2, s4)); printf("mystrcasecmp(\"%s\", \"%s\") = %d\n", s3, s4, mystrcasecmp(s3, s4)); printf("mystrncasecmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 3, mystrncasecmp(s1, s2, 3)); printf("mystrncasecmp(\"%s\", \"%s\", %u) = %d\n", s1, s2, 5, mystrncasecmp(s1, s2, 5)); printf("mystrncasecmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 3, mystrncasecmp(s1, s3, 3)); printf("mystrncasecmp(\"%s\", \"%s\", %u) = %d\n", s1, s3, 2, mystrncasecmp(s1, s3, 2)); return 0; } |
まとめ
C言語で文字列を比較するためには==演算子ではなく,strcmp/strncmp関数を利用します.
また,memcmp関数やstrcasecmp/strncasecmp関数も有用であることがわかりました.
今回学んだ関数の比較は下表になります.
項目 | strcmp/strncmp関数 | memcmp関数 | strcasecmp/strcasecmp関数 |
---|---|---|---|
比較対象 | 文字列 | メモリデータ | 文字列 |
複数文字列の比較 | できない | できる | できない |
大文字と小文字の区別 | あり | あり | なし |
C言語を独学で習得することは難しいです.
私にC言語の無料相談をしたいあなたは,公式LINE「ChishiroのC言語」の友だち追加をお願い致します.
私のキャパシティもあり,一定数に達したら終了しますので,今すぐ追加しましょう!
独学が難しいあなたは,元東大教員がおすすめするC言語を学べるオンラインプログラミングスクール5社で自分に合うスクールを見つけましょう.後悔はさせません!