AIがデータを正確に読み取るためには、一貫性のあるきれいなデータが必要となる。AIは、データの中にぽっかりと空いた「空白セル」を人間のように「ああ、ここはまだ入力されていないんだな」と理解することが難しい場合がある。
そのため、AIに好かれるデータを作るには、欠損値や不明なデータには、空白のままにせず、特定の記号(例:NA、0、NULL、-)を入力して意図的に区別することが重要だ。
たとえば、アンケートの未回答や、取得できなかったデータに「NA」(Not Applicable)や「-」といった記号を意図的に入力する。これにより、AIは「これは情報がないデータである」と明確に認識し、データ分析の際にそのセルを適切に処理できる。
空白セルは、データが存在しないのか、単に入力し忘れただけなのかを区別しにくく、特にAIに分析させる際、誤った結果を導く原因となる。
この「空白セルを極力なくす」というお作法は、AIとのコミュニケーションを円滑にするだけでなく、将来の自分や他の人がデータを見直すときにも、どこに未入力や不明な値があるかを一目で把握できるため、ミスの防止にもつながる。
最初は面倒に感じるかもしれないが、この作法を習慣化すれば、AI活用が格段にスムーズになるのだ。