英国AI安全研究所：AIの未来に向けた青写真？

英国フロンティアAIタスクフォースは、2023年4月に「ファウンデーションモデル・タスクフォース」として立ち上げられた政府資金による取り組みであり、現在は英国AI安全研究所へと発展しつつある。

英国のリシ・スナク首相は、2023年11月2日にイングランドのブレッチリー・パークで開催されたAI安全サミットの閉会演説で、同研究所の設立を発表した。

同氏は、英国政府がこの新組織に託す野心は、新たに登場する種類のAIの安全性を試験する任務を担う世界的ハブにすることだと述べた。

「研究所は、最先端AIの新しい種類について、公開前および公開後に慎重にテストを行い、AIモデルが持ち得る潜在的に有害な能力に対処する。偏見や誤情報といった社会的害から、人類がAIの制御を完全に失うといった最も起こりそうにないが極端なリスクまで、あらゆるリスクを探ることを含む」と、英国政府は公開声明で述べた。

この使命を追求するため、英国AI安全研究所は、アラン・チューリング研究所、インペリアル・カレッジ・ロンドン、TechUK、スタートアップ・コアリションといった国内組織と提携する。いずれも研究所の発足を歓迎している。

また、英国国内外の民間AI企業とも連携する。Google DeepMindやOpenAIなど、一部はすでにこの取り組みを公に支持している。

米国およびシンガポールとの提携を確認

スナク首相はさらに、同研究所が英国政府のAI戦略の最前線に立ち、AI安全における世界的リーダーとしての同国の地位を確固たるものにする使命を担うと付け加えた。

この役割を担うにあたり、英国AI安全研究所は他国の同様の機関と提携する。

首相はすでに、最近発表された米国AI安全研究所およびシンガポール政府と、AI安全テストで協力する2件の提携が確定したと発表している。

フロンティアAIタスクフォースの議長であるイアン・ホガースは、引き続き研究所の議長を務める。国家安全保障から計算機科学まで、業界の重鎮で構成されるタスクフォースの外部諮問委員会は、今後この新たな世界的ハブに助言を行う。

8社のAI企業がモデルの配備前テストに合意

さらにスナク首相は、オーストラリア、カナダ、フランス、ドイツ、イタリア、日本、韓国、シンガポール、米国、英国、そしてEU代表団を含む複数の国が、主要企業のAIモデルをテストするための合意に署名したと発表した。

この使命を支援するため、AI開発に関与する8社――Amazon Web Services（AWS）、Anthropic、Google、Google DeepMind、Inflection AI、Meta、Microsoft、Mistral AI、OpenAI――が、将来のAIモデルを公開前に利用できるアクセスを「深化」させることに合意した。

首相はAI安全サミットを締めくくり、国家安全保障およびその他の主要リスクに向けた次世代モデルの配備前テストにおける政府の役割について、8つの主要AI企業および志を同じくする国々との画期的な合意を発表した pic.twitter.com/lLmRZiX7Ip

— Matt Clifford (@matthewclifford) 2023年11月2日

Xでは、適切な立法上の安全策が整わない限りOpenAIのGPT4より大きいすべてのAIモデルの禁止を積極的に求めている非営利団体PauseAIが、この合意を「正しい方向への一歩」と呼んだ。

しかし、同団体は付け加えて、配備前テストのみに依存するのは危険だとした。

挙げられた理由は以下のとおり：

モデルは流出し得る（例：MetaのLLaMAモデル）。
危険な能力のテストは難しい。「例えば、AIが自己複製できるかどうかを（安全に）どうテストすればよいのか分からない。あるいは、人間を欺くかどうかをどうテストするのかも」とPause AIは述べた。
悪意ある者は依然として危険なAIを構築できる――そして配備前テストではそれを防げない。
一部の能力はAIラボ内ですら危険である。「例えば自己複製するAIは、配備前にラボから逃げ出す可能性がある」とPause AIは記した。
能力は学習後に追加または発見され得る。これには、ファインチューニング、ジェイルブレイク、実行時の改善が含まれる。

翻訳元: https://www.infosecurity-magazine.com/news/uk-ai-safety-institute-blueprint/

英国AI安全研究所：AIの未来に向けた青写真？

米国およびシンガポールとの提携を確認

8社のAI企業がモデルの配備前テストに合意

共有:

関連

関連記事

Infosecurity Europe：NCSCが警告、不確実性が続く今こそレジリエンス強化に向けた即時行動を

Infosecurity Europe：AIを活用しないサイバーセキュリティチームは「失敗する運命にある」

Infosecurity Europe：バイエル、AI脅威に対抗するためセキュリティ意識向上トレーニングを刷新