C言語のstrlen関数と自作関数で文字列の長さの計算方法を教えて!
こういった悩みにお答えします.
本記事の信頼性
- リアルタイムシステムの研究歴12年.
- 東大教員の時に,英語でOS(Linuxカーネル)の授業.
- 2012年9月~2013年8月にアメリカのノースカロライナ大学チャペルヒル校(UNC)コンピュータサイエンス学部で客員研究員として勤務.C言語でリアルタイムLinuxの研究開発.
- プログラミング歴15年以上,習得している言語: C/C++,Python,Solidity/Vyper,Java,Ruby,Go,Rust,D,HTML/CSS/JS/PHP,MATLAB,Verse(UEFN), Assembler (x64,aarch64).
- 東大教員の時に,C++言語で開発した「LLVMコンパイラの拡張」,C言語で開発した独自のリアルタイムOS「Mcube Kernel」をGitHubにオープンソースとして公開.
- 2020年1月~現在はアメリカのノースカロライナ州チャペルヒルにあるGuarantee Happiness LLCのCTOとしてECサイト開発やWeb/SNSマーケティングの業務.2022年6月~現在はアメリカのノースカロライナ州チャペルヒルにあるJapanese Tar Heel, Inc.のCEO兼CTO.
- 最近は自然言語処理AIとイーサリアムに関する有益な情報発信に従事.
- (AI全般を含む)自然言語処理AIの論文の日本語訳や,AIチャットボット(ChatGPT,Auto-GPT,Gemini(旧Bard)など)の記事を50本以上執筆.アメリカのサンフランシスコ(広義のシリコンバレー)の会社でプロンプトエンジニア・マネージャー・Quality Assurance(QA)の業務委託の経験あり.
- (スマートコントラクトのプログラミングを含む)イーサリアムや仮想通貨全般の記事を200本以上執筆.イギリスのロンドンの会社で仮想通貨の英語の記事を日本語に翻訳する業務委託の経験あり.
こういった私から学べます.
C言語を独学で習得することは難しいです.
私にC言語の無料相談をしたいあなたは,公式LINE「ChishiroのC言語」の友だち追加をお願い致します.
私のキャパシティもあり,一定数に達したら終了しますので,今すぐ追加しましょう!
独学が難しいあなたは,元東大教員がおすすめするC言語を学べるオンラインプログラミングスクール5社で自分に合うスクールを見つけましょう.後悔はさせません!
目次
C言語で文字列の長さの計算
C言語のstrlen関数で文字列の長さを計算する方法を紹介します.
また,strlen関数を拡張したstrnlen関数とstrnlen_s関数も紹介します.
strlen関数
1 |
size_t strlen(const char *s); |
strlen関数は,sが指す文字列の長さを計算します.
strlen関数はANSI C規格で定義されています.
また,NULL文字('\0')は計算に含まれません.
strlen関数の利用例
strlen関数の利用例は,以下のコードになります.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> #define BUFSIZE 16 int main(void) { char s[BUFSIZE] = "abc"; printf("strlen(%s) = %zu\n", s, strlen(s)); return 0; } |
実行結果は以下になります.文字列"abc"の長さが3と出力されていることがわかります.
1 2 3 |
$ gcc strlen.c $ a.out strlen(abc) = 3 |
strlen関数とsizeof演算子の違い
strlen関数とsizeof演算子の違いを以下のコードで解説します.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> #define BUFSIZE 16 int main(void) { char s1[BUFSIZE] = "abc"; char *s2 = "abcde"; printf("strlen(%s) = %zu\n", s1, strlen(s1)); printf("sizeof(%s) = %zu\n", s1, sizeof(s1)); printf("strlen(%s) = %zu\n", s2, strlen(s2)); printf("sizeof(%s) = %zu\n", s2, sizeof(s2)); return 0; } |
実行結果は以下になります.
sizeof演算子の結果は,配列の場合は配列のサイズ(この例ではBUFSIZEの16バイト),ポインタの場合はchar *型のサイズ(私の環境では8バイト)になることに注意して下さい.
1 2 3 4 5 6 |
$ gcc strlen_sizeof.c $ a.out strlen(abc) = 3 sizeof(abc) = 16 strlen(abcde) = 5 sizeof(abcde) = 8 |
strlen関数の自作
strlen関数の自作関数は以下のコードになります.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #define BUFSIZE 16 size_t mystrlen(const char *s) { size_t num = 0; while (*s++) { num++; } return num; } int main(void) { char s[BUFSIZE] = "abc"; printf("mystrlen(%s) = %zu\n", s, mystrlen(s)); return 0; } |
実行結果は以下になります.
文字列"abc"の長さを3と計算できていることがわかります.
1 2 3 |
$ gcc mystrlen.c $ a.out mystrlen(abc) = 3 |
strlen関数の問題点
strlen関数は,NULL文字を発見するまで読み込んでしまいます.
もし確保したメモリ領域の中にNULL文字がない場合,バッファオーバーリードが発生して,その外側のメモリ領域まで読み込んでしまいます.
バッファオーバーリードのコードは以下になります.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> #define BUFSIZE 16 int main(void) { char s1[BUFSIZE]; char *s2; memset(s1, 'a', sizeof(s1)); printf("strlen(%s) = %zu\n", s1, strlen(s1)); printf("strlen(%s) = %zu\n", s2, strlen(s2)); return 0; } |
私の環境での実行結果は以下になります.
配列s1のサイズが16なのに対して,文字列の長さが22になっています.
また,初期化していないs2の文字列の長さが11になり,文字化けが発生しています.
1 2 3 4 |
$ gcc strlen_buffer_overread.c $ a.out strlen(aaaaaaaaaaaaaaaap) = 22 strlen(L�=C+) = 11 |
strnlen関数
1 |
size_t strnlen(const char *s, size_t maxlen); |
strnlen関数では,strlen関数で発生するバッファオーバーリードの問題を回避できます.
具体的には,strnlen関数は第2引数のmaxlenに読み込む上限を設定できます.
ここで,strnlen関数はC言語の標準ではなく,POSIX.1-2008規格です.
なので,処理系によってはstrnlen関数が存在しない場合があることに注意して下さい.
strnlen関数の利用例
strnlen関数の利用例は以下のコードになります.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> #define BUFSIZE 16 int main(void) { char s[BUFSIZE] = "abc"; printf("strnlen(%s, %d) = %zu\n", s, 3, strnlen(s, 3)); printf("strnlen(%s, %d) = %zu\n", s, 2, strnlen(s, 2)); printf("strnlen(%s, %d) = %zu\n", s, 4, strnlen(s, 4)); return 0; } |
実行結果は以下になります.
strnlen関数の返り値が第2引数で指定した読み込む上限以下になっていることがわかります.
1 2 3 4 5 |
$ gcc strnlen.c $ a.out strnlen(abc, 3) = 3 strnlen(abc, 2) = 2 strnlen(abc, 4) = 3 |
strnlen関数の自作
strnlen関数の自作は以下のコードになります.
自作したmystrlen関数とstrlen関数の違いは,maxlenを超えない範囲でwhileループを実行して配列の要素を読み込むことです.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #define BUFSIZE 16 size_t mystrnlen(const char *s, size_t maxlen) { size_t num = 0; while (num < maxlen && *s++) { num++; } return num; } int main(void) { char s[BUFSIZE] = "abc"; printf("mystrnlen(%s, %d) = %zu\n", s, 3, mystrnlen(s, 3)); printf("mystrnlen(%s, %d) = %zu\n", s, 2, mystrnlen(s, 2)); printf("mystrnlen(%s, %d) = %zu\n", s, 4, mystrnlen(s, 4)); return 0; } |
実行結果は以下になります.
1 2 3 4 5 |
$ gcc mystrnlen.c $ a.out mystrnlen(abc, 3) = 3 mystrnlen(abc, 2) = 2 mystrnlen(abc, 4) = 3 |
strnlen_s関数
1 |
size_t strnlen_s(const char *s, size_t maxlen); |
strnlen_s関数は,strnlen関数と同じくバッファオーバーリードを回避する関数です.
strnlen_s関数は,C11規格のオプションです.
GCC/Clangでは実行できませんが,Visual Studioで実行できます.
第1引数にNULLを指定するとstrnlen_s関数は0を返しますが,strlen関数とstrnlen関数はセグメンテーション違反が発生します.
ただし,strnlen関数の第2引数が0の場合は0を返すことに注意して下さい.
strnlen_s関数の利用例
strnlen_s関数の利用例は以下になります.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> #define BUFSIZE 16 int main(void) { char s[BUFSIZE] = "abc"; printf("strnlen_s(%s, %d) = %zu\n", s, 3, strnlen_s(s, 3)); printf("strnlen_s(%s, %d) = %zu\n", s, 2, strnlen_s(s, 2)); printf("strnlen_s(%s, %d) = %zu\n", s, 4, strnlen_s(s, 4)); return 0; } |
Visual Studioでの実行結果は以下になります.
1 2 3 4 5 6 |
strnlen_s(abc, 3) = 3 strnlen_s(abc, 2) = 2 strnlen_s(abc, 4) = 3 *.exe (プロセス *) は、コード 0 で終了し ました。 このウィンドウを閉じるには、任意のキーを押してください... |
strnlen_s関数の自作
strnlen_s関数の自作は以下のコードになります.
mystrnlen関数とは異なり,mystrnlen_s関数は第1引数がNULLかどうか判定します(14~16行目).
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 |
/* * Author: Hiroyuki Chishiro * License: 2-Clause BSD */ #include <stdio.h> #include <string.h> #define BUFSIZE 16 size_t mystrnlen_s(const char *s, size_t maxlen) { size_t num = 0; if (!s) { return 0; } while (num < maxlen && *s++) { num++; } return num; } int main(void) { char s[BUFSIZE] = "abc"; printf("mystrnlen(%s, %d) = %zu\n", s, 3, mystrnlen(s, 3)); printf("mystrnlen(%s, %d) = %zu\n", s, 2, mystrnlen(s, 2)); printf("mystrnlen(%s, %d) = %zu\n", s, 4, mystrnlen(s, 4)); return 0; } |
実行結果は以下になります.
※自作関数なので,GCC/Clangで実行できます.
1 2 3 4 5 |
$ gcc mystrnlen_s.c $ a.out mystrnlen_s(abc, 3) = 3 mystrnlen_s(abc, 2) = 2 mystrnlen_s(abc, 4) = 3 |
まとめ
C言語のstrlen関数で文字列の長さを計算する方法を紹介しました.
また,strlen関数のバッファオーバーリードを回避するstrnlen関数とstrnlen_s関数も紹介しました.
今回学んだ関数は下表になります.
項目 | strlen関数 | strnlen関数 | strnlen_s関数 |
---|---|---|---|
規格 | ANSI C | POSIX.1-2008 | C11 |
実行可能な開発環境 | GCC/Clang/Visual Studio | GCC/Clang/Visual Studio | Visual Studio |
バッファオーバーリードの回避 | できない | できる | できる |
第1引数にNULL | セグメンテーション違反 | 第2引数が0の場合は0を返す. 第2引数が1以上の場合は セグメンテーション違反. | 0を返す |
C言語を独学で習得することは難しいです.
私にC言語の無料相談をしたいあなたは,公式LINE「ChishiroのC言語」の友だち追加をお願い致します.
私のキャパシティもあり,一定数に達したら終了しますので,今すぐ追加しましょう!
独学が難しいあなたは,元東大教員がおすすめするC言語を学べるオンラインプログラミングスクール5社で自分に合うスクールを見つけましょう.後悔はさせません!