Shikata Ga Nai

Private? There is no such things.

第12回:データ型の種類:数字・文字・通貨・日付

Hello there, ('ω')ノ

データ分析を行ううえでとても重要なのが、「データの型(データ型)」の理解です。 実は、見た目が同じでも中身の型が違うと、正しく集計できないことがあります。

たとえば、数字に見えるのに合計できない。日付なのに並び順がおかしい。 こうしたトラブルの原因は、「データ型の指定ミス」であることがほとんどです。


✅ そもそも「データ型」って何?

データ型(Data Type) とは、「そのデータが何を表すものか、どのように扱うべきか」をコンピュータに教えるための分類のことです。

たとえば:

  • 「123」→ 数値として計算する?
  • 「123」→ 郵便番号として扱う?

見た目は同じでも、使い方によって意味が大きく変わります。 だからこそ、正しい型を指定することが非常に重要なんです。


① 数値型(Numeric)

🔢 数字を扱うための型

数値型は、加算・平均・最大値・最小値などの集計処理ができる型です。

分類 説明
整数型(INT) 小数なしの数字 10, 250, -8
小数型(FLOAT, DOUBLE) 小数を含む数字 3.14, -0.5

✅ 注意ポイント

  • 郵便番号「123-4567」や商品番号「00123」は数値に見えても文字列にすべき
  • 数値型にしてしまうと「先頭の0」が消えてしまいます

② 文字列型(Text / String)

📝 文字や記号を扱うための型

名前や住所、商品コードなど、計算ではなく比較や検索に使う情報は文字列型にします。

分類 説明
固定長(CHAR) 文字数が固定 郵便番号「1234567」
可変長(VARCHAR) 文字数がバラバラ 名前「山田 太郎」

✅ 注意ポイント

  • 数字っぽいけど演算しないデータ(例:社員番号、電話番号)は文字列として扱うべき
  • 名前や住所を数値型にすると、意味不明なデータになる可能性があります

③ 通貨型(Currency / Money)

💰 金額や価格を扱うための型

通貨型は、桁区切りや通貨記号(¥、\$など)を含めて、金額として扱うための型です。

例:

商品名 単価(通貨型)
ノートPC ¥120,000
マウス ¥2,500

✅ 通貨型のメリット:

  • 自動的に小数点以下を制御(例:¥1,234.00)
  • 通貨記号の表示が可能
  • 精度の高い金額計算が可能(特に会計・経理分野で重要)

④ 日付・時刻型(Date / Time / Timestamp)

📅 日付や時間を扱うための型

日付型は、日付・時刻の並び替え・抽出・差分計算などができる型です。

分類 説明
DATE 年月日のみ 2025-06-21
TIME 時分秒のみ 14:30:00
DATETIME(または TIMESTAMP) 年月日+時分秒 2025-06-21 14:30:00

✅ よくあるミス

  • 日付が文字列として保存されていると、並び順がバラバラになる
  • 「2025/1/1」と「2025-01-01」は見た目は同じでも、型が違うとソートや集計に影響

📌 データ型が正しくないとどうなる?

ケース 結果
数字が文字列型になっている 合計や平均ができない
日付が文字列になっている 並び順や期間集計が正しくできない
商品コードを数値にしている 先頭の「0」が消える(例:00123 → 123)

▶ だからこそ、「このデータは何を表しているのか」に合わせて、適切な型で扱うことが大切です。


✨ まとめ:データ型は“データの取扱説明書”

データ型 主な用途 注意点
数値型 計算・集計が必要なデータ 数字に見えても演算しないものは注意
文字列型 名前・ID・記号など 数値っぽいIDは文字列にする
通貨型 金額・価格データ 桁数や小数点精度に注意
日付型 日付・時間の処理 並び順・期間集計には必須

Best regards, (^^ゞ