AIの統計が示す日本の課題
スタンフォード大学人間中心人工知能研究所(Stanford Institute for Human-Centered Artificial Intelligence)(参考資料1)から“2021年版人工知能大全”ともいうべき資料集「AI Index Report for 2021」(参考資料2)(以下Index Reportと記す)が2021年3月3日に発刊された。222頁にわたる豊富なデータを集積した資料集である。既にIEEE の E. Strickland氏は、その中から15枚のグラフを抜粋して抄録をまとめ、2021年4月22日に配信されたIEEE Spectrumに掲載している(参考資料3)。
AIの動向を注視している身として興味津々、早速通読した。ここではIndex Reportの中で、特に学界と産業界の統計で筆者が注目した点をまとめ、日本の課題の一端に触れる。即ち、学界では論文数の増加とレベルアップが続き、中国からの論文がインパクト・ファクターの点でもトップに躍り出た。また産業界を見ると北米では新PhD取得者の職場が用意され、その求人市場もグローバルになっている。一方、学界、産業界共に統計では日本の影が、まことに薄い。
<学界動向>
1) AI関連発表論文件数は、正にいわゆる第3のブームを示している
図1はIndex Reportで示された2000年から2019年にわたるAIの査読論文発表件数の推移を示したものである。出典はElsevier /Scopus 2020(参考資料4)で、5000以上の国際的な学会誌から7000万件の査読付き論文を調査した結果と記されている。順調に伸びて、2019年は2000年比約12倍の件数に到達している。挿入図は2000年代から始まったいわゆる第3次AIブームで、2010年代に機械学習、そしてディープラーニングの大波が続く “AIの歴史(参考資料5)”を示しているが、この波の重なりも図1で読み取れる。
Index Reportの説明では「2000年にはAI関連査読論文数が全査読論文数の0.82%であったのが、2019年には3.8%に上昇している」と記されており(第18頁)、その%値の推移が示されている(第19頁上段Fig.1.1.1b)。これも同じElsevier /Scopus 2020からのものであり、査読付き論文数の割合が増えていることは、全般的な論文の質の向上も進んでいることを示しているので、注目しておく必要があろう。Index Reportでは産学協同研究の査読付きAI論文発表件数2015年〜19年累計も示されており、日本は、米国、EU、中国、英国、ドイツに次いで6番目に入っていたのはホッとする数字であった(第23頁Fig.1.1.5)。
その他、Index Reportでは出典がそれぞれ異なるものの、AI学会出版物全般での発表論文の推移や特許文献の推移(共にMicrosoft Academic Graph(参考資料6)出典)、更にオンラインで査読前の論文発表も含めた発表論文数の推移(arXiv (参考資料7)出典)も解説されているので、興味がある読者はそちらを一読されたい。2015年〜2020年のオンライン発表件数では北米が1位である。
2) サイテーション(インパクト・ファクター)でも中国がトップ
Index Reportでは、AI論文のサイテーション(他の論文での引用率)、つまりインパクト・ファクターが高い論文数の割合の推移も示されている。出典はMicrosoft Academic Graph 2020(参考資料6)であり、サイテーション率はMicrosoft開発のソフトによると記されている。
表1はIndex Reportのグラフ(Fig.1.1.10)から、必要な年の値を読み取って傾向が判る表にしたものである。地域別に米国、欧州、中国でサイテーション率が比較されており、2019年と比較しても明らかなように、2020年では欧州11.0%、米国19.8%に対して中国20.7%となって、初めてトップに立った。これがトピックスとしてIndex Report 2021年度版の特記事項全9項目の一つにも取り上げられている(Index Report第4頁)。表1に示すように中国は2000年比で2020年は実に20倍である。
もともとの発表論文数の推移では、2016年、17年を除き2005年からずっと中国がトップである(Index Report第27頁Fig.1.1.9)。そして査読付き論文発表件数の推移を見ても、2017年から中国はトップであるし、2008年〜11年もトップだった(Index Report第20頁Fig.1.1.3)。そしていよいよサイテーションでも2020年に米国並みになったということで注目されたのだろう。しかしこれは驚くには当たらないと思う。2017年から実質的には世界を牽引していたからである。
もちろん、サイテーション/インパクト・ファクターが全てではない。このことは例えば最近でも東京大学須藤靖教授が麻生一枝著「インパクト・ファクターの正体」(参考資料8)の書評(参考資料9)で書かれている。とは言え、サイテーション率は研究者間の切磋琢磨も意味するので、論文の質の向上を示す指標としては一概に無視はできない。筆者も論文誌の評価を確認する指標として、サイテーション率を活用してきた経緯がある(参考資料10)。
さて、ここで以上の件を、筆者によるセミコンポータル・ブログ(参考資料11)で述べた結果で検証してみよう。そこでは、IEEE Transactions on Internet of Things誌において2014年創刊号から2018年まで、各号掲載の論文数の推移と研究機関の国別分析の結果をまとめておいた。これは当然査読付き論文の範疇に属するが、筆者の調査結果でも掲載論文数は2016年から急上昇しており、図1と符合する。
つまりIndex Report記載の傾向は、以前に筆者が単に一つの専門誌から分析した結果とも符合しており、大勢は変わっていない。むしろこのIndex Reportでより一層裏付けられたことになる。
<産業界動向>
3) コンピュータサイエンスPhD取得者の就職先
ポスドクの職場が少ないとよく話題になる日本として、気になるのはAI分野でPhD学位を取得した者の就職先である。Index Report ではComputing Research Association のTaulbee Survey2020年報(参考資料12)を出典としてAI職の雇用情勢をまとめている。その具体例が、北米で2010年から2019年までのPhD取得者が赴く就職先(Employment)を、Academia(学界)とIndustry(産業界)に分類したグラフ(Fig.4.2.5b)である。
それによると2010年〜2011年ではほぼ両者は同じであったが、その後学界就職者の割合が減り始め、代わって産業界就職者の割合が増えて、2019年では前者が23.7%に対し、後者は65.7%になっている。
比較しやすいように統計を取り始めた2010年値と最後の2019年値のみグラフから読み取り、表にしたのが表2である。
絶対値が示されている資料をIndex Reportで探したが見当たらなかった。それがあればもっとはっきりするのであろうが、Academiaでは急にはポストを増やせないので、産業界の就職先の増加で、彼らの雇用要求分が吸収され、職が確保されているとのことである。
つまり北米では学界から新PhD取得者が生み出されるとともに、彼らの就職先が産業界で用意されているということである。
なお、Index Reportでは、9項目のトピックスの一つとして、北米における新学位取得者の64%が留学生で、その大部分が実社会に出ても米国に滞在し続けているとも記されている(同資料第4頁)。
4) AI業界求職市場(Hiring Market)のグローバル化
Index ReportではLinkedInのつながり範囲から、AI業界の雇用情勢を調査している。具体的にはAIスキル保持者またはAI関連職従事者になった者が就職して新たに雇用主をLinkedInに加えた件数を、その国の全LinkedIn会員数で割った数値を用いて、その時点でのその国におけるAI雇用指標としている。数値は毎月更新されるとのことで、Index Reportでは、2016年の各月の平均値と2020年12月値とを比較してその間の伸び率を国別に比較している(Fig.3.1.1)。あくまでも雇用数の絶対値ではなく、この期間のAI雇用指標の伸長率であることに注意しておいてほしい。
この調査方法では当然LinkedInの普及率も雇用情勢を読み解く精度に関係する。そのためサンプリングには原則として全労働者数の40%以上がLinkedInに加入している国を取り上げている。インドと中国は40%に達していないが、この2か国の数値はグローバル経済を考えるときに重要なので含めたとの説明が脚注にあった。従ってこの2ヵ国のデータは必ずしも他の数字と同列には並べられない。
表3はそのIndex Reportのグラフから各国の値を読み取り、表にまとめたものである。ここで仮に1.05とあれば2020年12月には2016年平均値から5%伸長したことを意味する。
表に示したように、2016年から2020年末にかけて、ブラジルのAI雇用数の伸び率は実に約3.4倍に伸び、インド、カナダ、シンガポール、南アフリカが伸び率の大きい国として続いている。雇用の絶対値では米国、中国がホットスポットだと記されている。しかし伸び率の大きな国から今後何が飛び出してくるか判らないので、この調査結果を注目しておく意味があると説明されていた。
この調査方法の妥当性にも議論があろう。AI雇用情勢に絞った各国政府の公式発表が少ないためにこの方法をとったものと考えられる。筆者には日本での勤労者数に対するLinkedInの普及率が不明なので日本が含まれていない。このため正確な理由は判らない。
しかしここでも先の筆者のブログ(参考資料11)のデータで検証すると、調査した学術誌でもIT論文筆頭著者の所属研究機関は今や全世界に散らばっていた。しかも同ブログで円グラフに示したように中国、米国からの論文が圧倒的に多い。反面、日本はトップ10にも入らず、その他グループの一つに過ぎなかった。
杞憂であればよいが、仮にそのこととも符合するとしたら、この調査にはLinkedIn普及率40%以下の2か国も、世界経済を考えるときに注目すべき国であるとして意図的に含まれているので、そこにも入っていない日本は、やはりAI雇用市場からも相手にされていないということになる。表3のような国々が米国や中国のAI事業を押し上げているとすれば、なおさら寂しさを噛み締めねばならない。
<まとめ>
職が無ければ良い学生や院生、研究者は集まらない。その意味で、北米はPhD取得者の職が用意されている、ということである。幸い最近津田建二編集長(参考資料13)や筆者(参考資料14)も記したように、日本でもITベンチャーが増えはじめ、起業する者も増加している。DX時代に向けてデジタル庁も誕生し、高校の教科書にも「情報」が取り入れられる時代になった。折角学んだ若者が国内で活躍できるよう、AI、ひいてはIT産業界での求人数が増えることを願ってやまない。もちろん、日本に留まることなく全世界に羽ばたいて活躍してもらいたいが、誰でも、というわけには行かないだろう。国富につなげるためにも国内の技術者層を厚くしなければならない。そのためには国内でもある程度の求人数が必須である。そして明るい未来像を若者達の前に見せる必要がある。半導体事業が勃興したころは、実験設備や研究環境は今とは比較にならないくらい貧弱であった。それでも学生、院生、そして研究者には煮えたぎる情熱があったことを思い起こしてほしい。
折しも2021年4月22日にインテルのWebinar で、同社の新製品Xeonの発表を視聴する機会があった(参考資料15)。インテル株式会社代表取締役社長の鈴木国正氏司会で、インテル コーポレーション主席副社長 N. Shenoy氏、同じく副社長 L. Spelman氏、そしてCEOの P. Gelsinger氏の講演が続き、鈴木社長が締めくくった。Xeon プロセッサーの優位性やそれによるソリューションが判りやすく、かつ熱を込めて語られ、思わず流石この業界を牽引する企業だけあると惚れ惚れするくらい、それぞれが自信に溢れた話であった。
PhD取得者のため、このような夢のある企業や組織で、国内にも就職口があるようにと、今後の発展を願いながら視聴した。またこのような企業に続くよう、日本のAIベンチャー企業の発展を祈念しながら、日本人技術者の活躍を願っている。
<謝辞>
毎度のことだがセミコンポータル編集長津田建二氏にはご多忙の中、忌憚のないご意見と懇切丁寧な査読を賜った。厚く御礼申し上げたい。
参考資料
1. Stanford Institute for Human-Centered Artificial Intelligence (Stanford HAI)
日本文
2. D. Zhang, et.al, 「AI Index Report for 2021(第4版)」、(2021/03/03)(但し本文中に記した日本語表題「大全」は元Electronic Journal社が使っていた言葉に倣って筆者がつけたもので、公式なものではない)
3. E. Strickland, “15 Graphs You Need to See to Understand AI in 2021” 、IEEE Spectrum Tech Alert (2021/04/22)
4. Elsevier Scopus
5. 例えば松尾 豊, 「人工知能は人間を超えるか」、KADOKAWA刊 (2015)、中でもpp.60-61に「人工知能研究のブームと冬の世界の繰り返し」が模式図と共に説明されている。
6. Microsoft Academic Graph - Microsoft Research
7. arXiv
8. 麻生一枝,「科学者をまどわす魔法の数字、インパクト・ファクターの正体」、日本評論社刊 (2021/01/19)
9. 須藤靖, 「格付けで問われるモラル」、朝日新聞・読書欄(2021年4月24日)
10. 例えば鴨志田元孝、「技術者、研究者の層を更に厚くする方策を望む」、セミコンポータル (2016/06/14)
11. 鴨志田元孝、「IoT・ナノテク論文の少なさ、これで良いのだろうか?頑張れ、日本!」、セミコンポータル (2018/06/18)
12. Taulbee Survey
13. SPIフォーラム 国内で立ち上がる半導体ベンチャーたち、セミコンポータル主催 (2020/11/04)
14. 鴨志田元孝、「AI・人工知能EXPO2020(秋)に出展した日系ベンチャー企業の発展を祈って」、セミコンポータル (2021/02/05)
15. 「第3世代インテルXeonスケータブル・プロセッサの新製品情報/ソリューションをいち早くご紹介―インテル・データ・セントリック・イノベーション・デイ2021―Performance made flexible」、 Intel Corporation