Hello there, ('ω')ノ
データ分析を行ううえでとても重要なのが、「データの型(データ型)」の理解です。 実は、見た目が同じでも中身の型が違うと、正しく集計できないことがあります。
たとえば、数字に見えるのに合計できない。日付なのに並び順がおかしい。 こうしたトラブルの原因は、「データ型の指定ミス」であることがほとんどです。
✅ そもそも「データ型」って何?
データ型(Data Type) とは、「そのデータが何を表すものか、どのように扱うべきか」をコンピュータに教えるための分類のことです。
たとえば:
- 「123」→ 数値として計算する?
- 「123」→ 郵便番号として扱う?
見た目は同じでも、使い方によって意味が大きく変わります。 だからこそ、正しい型を指定することが非常に重要なんです。
① 数値型(Numeric)
🔢 数字を扱うための型
数値型は、加算・平均・最大値・最小値などの集計処理ができる型です。
分類 | 説明 | 例 |
---|---|---|
整数型(INT) | 小数なしの数字 | 10, 250, -8 |
小数型(FLOAT, DOUBLE) | 小数を含む数字 | 3.14, -0.5 |
✅ 注意ポイント
- 郵便番号「123-4567」や商品番号「00123」は数値に見えても文字列にすべき
- 数値型にしてしまうと「先頭の0」が消えてしまいます
② 文字列型(Text / String)
📝 文字や記号を扱うための型
名前や住所、商品コードなど、計算ではなく比較や検索に使う情報は文字列型にします。
分類 | 説明 | 例 |
---|---|---|
固定長(CHAR) | 文字数が固定 | 郵便番号「1234567」 |
可変長(VARCHAR) | 文字数がバラバラ | 名前「山田 太郎」 |
✅ 注意ポイント
- 数字っぽいけど演算しないデータ(例:社員番号、電話番号)は文字列として扱うべき
- 名前や住所を数値型にすると、意味不明なデータになる可能性があります
③ 通貨型(Currency / Money)
💰 金額や価格を扱うための型
通貨型は、桁区切りや通貨記号(¥、\$など)を含めて、金額として扱うための型です。
例:
商品名 | 単価(通貨型) |
---|---|
ノートPC | ¥120,000 |
マウス | ¥2,500 |
✅ 通貨型のメリット:
- 自動的に小数点以下を制御(例:¥1,234.00)
- 通貨記号の表示が可能
- 精度の高い金額計算が可能(特に会計・経理分野で重要)
④ 日付・時刻型(Date / Time / Timestamp)
📅 日付や時間を扱うための型
日付型は、日付・時刻の並び替え・抽出・差分計算などができる型です。
分類 | 説明 | 例 |
---|---|---|
DATE | 年月日のみ | 2025-06-21 |
TIME | 時分秒のみ | 14:30:00 |
DATETIME(または TIMESTAMP) | 年月日+時分秒 | 2025-06-21 14:30:00 |
✅ よくあるミス
- 日付が文字列として保存されていると、並び順がバラバラになる
- 「2025/1/1」と「2025-01-01」は見た目は同じでも、型が違うとソートや集計に影響
📌 データ型が正しくないとどうなる?
ケース | 結果 |
---|---|
数字が文字列型になっている | 合計や平均ができない |
日付が文字列になっている | 並び順や期間集計が正しくできない |
商品コードを数値にしている | 先頭の「0」が消える(例:00123 → 123) |
▶ だからこそ、「このデータは何を表しているのか」に合わせて、適切な型で扱うことが大切です。
✨ まとめ:データ型は“データの取扱説明書”
データ型 | 主な用途 | 注意点 |
---|---|---|
数値型 | 計算・集計が必要なデータ | 数字に見えても演算しないものは注意 |
文字列型 | 名前・ID・記号など | 数値っぽいIDは文字列にする |
通貨型 | 金額・価格データ | 桁数や小数点精度に注意 |
日付型 | 日付・時間の処理 | 並び順・期間集計には必須 |
Best regards, (^^ゞ