Q.Etban McCallum
バッドデータハンドブック
データにまつわる問題への19の処方箋
ガイド
何がバッドデータで何がグッドデータなのか、それが問題だ
書誌
author | Q.Etban McCallum |
editor | 磯蘭水(監訳)、笹井崇司(訳) |
publisher | オライリー・ジャパン |
year | 2013 |
price | 2800+tax |
isbn | 978-4-87311-640-2 |
履歴
editor | 唯野 |
2022.6.28 | 読了 |
2022.6.28 | 公開 |
一言にバッドデータといってもその捉え方・対処方法によってはバッドデータではなくなるわけであり、あらゆるものがデータとして呼べるときには「何がバッドデータなのか(=何がグッドデータなのか)」ということがそもそも難しい問題になる。
そのため本書では「これがバッドデータだ」という切り分けなどには触れず、様々な状況おける対処を、章ごとに異なる筆者が経験などから説明する――という内容になっている。そして考えてみれば、これは上述したようにバッドデータ自身の定義が曖昧である以上、結果的に必然的なアプローチではないかと思った。
特別にデータサイエンティストなどに的を絞っているわけでもないので、IT関係者――特にビギナー――であれば一読してみるだけの価値があると感じた。
抄録
vi
-/-そして、この本は具体的な細々としたテクニックというよりも、むしろ、「Bad Dataと正面から向き合う人へのメッセージを集めたもの」と理解するに至ったというわけです。-/-
1
私たちはでーたから洞察を得るのが好きなんです。データそのものが好きなのとは少し違います。
要するに、バッドデータとは邪魔になるデータのことです。-/-
10
よくやる間違いは、フィールドの単位や意味を間違って解釈してしまうことです。-/-
11.
こうした事例によるチェックは、フィールドに格納されている値の妥当性検証へと広げることができます。-/-