第3講 社会でどのようなデータが活用されているか
からトピックを3つまとめてみた。
ログ(動作記録)によるアクセスデータの照らし合わせで、より価値のあるデータとなることがあります。
この記述を読んで、
ふと思った。
iPhone / iPadの内蔵時計は正確なんだろうか?
本書に答えがあった。
パソコンやスマホの時計は、一般的に精度が低く、時刻が狂いやすので、
NTP(Network Time Protocol)という技術を使って、時刻を自動的に修正している
から正確で、
iPhoneは、携帯電話回線を利用して時刻を自動的に修正する規格「NITZ(Network Identity and Time Zone)(*1)」に対応している
そうだ。
信じないわけではないが念のため、
NTPサーバーが参照している
「原子時計」pro
というアプリをインストールしてみた。
メタデータとは、
で、芝居の台本のト書きのようなもの。
例えば、
Webページを作るための技術である
HTML(Hyper Text Markup Language)は、
メタデータで構成されている。
名前にある「Markup」とは記号で囲うことで、
HTMLでは、メタデータは〈 〉(タグ)によって囲われていて、
ブラウザで見ると〈 〉で囲まれたメタデータは表示されず、
内容だけが表示される。
AI学習では、
Webサイトからデータをスクレイピングするときに、
この知識がないと手も足もでない。
なので、『1冊ですべて身につくHTML &CSSとWebデザイン入門講座』
で、サクッとWebサイトの作り方を学んでおくのがいい。
Excelなどの表計算ソフトで扱うデータベースは、
構造化データ(*2)と呼ばれ、
文章、動画、静止画、音声などは、
非構造化データと呼ばれる。
ただ、注意点として、
AIで画像や文章などの非構造化データが活用されているので、
構造化データより非構造化データのほうが偉い
という勘違いをしないように
という。
とくにデータを構造化して保存するデータベースは、
「ITパスポート試験」の出題範囲でもあり、
正規化やSQL(*3)などは、
DX人材やデジタル人材をめざすには、
おさえておきたいところだ。
(第4講に続く)
*3 基本情報技術者試験では具体的に問われる。
ベストセラーの『スッキリわかるSQL入門 第2版』で手を動かして覚えるのがおすすめ。