ホーム > 読んだ

Q.Etban McCallum
バッドデータハンドブック
データにまつわる問題への19の処方箋

ガイド

何がバッドデータで何がグッドデータなのか、それが問題だ

書誌

authorQ.Etban McCallum
editor磯蘭水(監訳)、笹井崇司(訳)
publisherオライリー・ジャパン
year2013
price2800+tax
isbn978-4-87311-640-2

目次

1本文
2抄録
311.
4.

履歴

editor唯野
2022.6.28読了
2022.6.28公開

一言にバッドデータといってもその捉え方・対処方法によってはバッドデータではなくなるわけであり、あらゆるものがデータとして呼べるときには「何がバッドデータなのか(=何がグッドデータなのか)」ということがそもそも難しい問題になる。

そのため本書では「これがバッドデータだ」という切り分けなどには触れず、様々な状況おける対処を、章ごとに異なる筆者が経験などから説明する――という内容になっている。そして考えてみれば、これは上述したようにバッドデータ自身の定義が曖昧である以上、結果的に必然的なアプローチではないかと思った。

特別にデータサイエンティストなどに的を絞っているわけでもないので、IT関係者――特にビギナー――であれば一読してみるだけの価値があると感じた。

抄録

vi

-/-そして、この本は具体的な細々としたテクニックというよりも、むしろ、「Bad Dataと正面から向き合う人へのメッセージを集めたもの」と理解するに至ったというわけです。-/-

1

私たちはでーたから洞察を得るのが好きなんです。データそのものが好きなのとは少し違います。

要するに、バッドデータとは邪魔になるデータのことです。-/-

10

よくやる間違いは、フィールドの単位や意味を間違って解釈してしまうことです。-/-

11.

こうした事例によるチェックは、フィールドに格納されている値の妥当性検証へと広げることができます。-/-