中国の研究チーム、恒星スペクトルを“翻訳”するAI「SpecCLIP」開発 - NewsTomo

異なる望遠鏡が集めた恒星スペクトル（星の光を波長ごとに分けたデータ）を、同じ“言語”として扱えるAIが登場しました。中国の研究チームが開発した「SpecCLIP」は、巨大化する天文データの統合と分析を一段と進める可能性があります。

何が発表されたのか：SpecCLIPという「恒星データの通訳」

科学技術日報が2月25日（水）に報じたところによると、中国科学院国家天文台や中国科学院大学（UCAS）などの研究チームが、恒星スペクトルを解析するAIモデル「SpecCLIP」を開発しました。

恒星スペクトルには、星の温度、化学組成（含まれる元素）、表面重力といった“指紋”のような情報が含まれます。これを大量に解析することで、天文学者は天の川銀河が誕生してから現在に至る進化の道筋をたどれます。

壁になっていたのは「データが方言だらけ」問題

課題は、観測プロジェクトごとにデータの取り方が異なることです。中国のLAMOST（大規模多天域多目標ファイバー分光望遠鏡）と、欧州のGaia衛星のように、分解能（細かさ）や波長範囲、取得方式が違うと、同じ星を見ていてもデータの“書き方”が揃いません。

その結果、複数の観測データを単純に混ぜて大規模解析することが難しく、研究のスケールアップにとって大きなボトルネックになっていました。

どう解決した？大規模言語モデルに似た発想＋対比学習

研究チームは、天文学に「大規模言語モデル（LLM）の発想に近い概念」を取り入れ、さらに対比学習（似ている・違うを手がかりに表現を学ぶ手法）を用いて、異なる装置由来のスペクトル同士の“内在的なつながり”をAIが自律的に学習できるようにしたといいます。

UCASの黄洋氏によれば、SpecCLIPはLAMOSTの低分解能スペクトルと、Gaiaの高精度スペクトルを「普遍的な言語」に変換する翻訳者のように働き、装置やサーベイ（観測計画）をまたいだデータの整列・変換を容易にします。

できること：単機能ではなく“基盤に近い”枠組み

研究によると、SpecCLIPは特定のタスク専用モデルにとどまらず、基盤モデルに近い枠組みとして位置づけられています。具体的には、次のような用途が挙げられています。

恒星大気パラメータや元素存在量（どの元素がどれくらいあるか）の一括推定
スペクトルの類似検索（似た星を大量データから探す）
特異な天体（通常と異なる特徴をもつ対象）の発見支援

なぜ今重要？「銀河考古学」と“レアな古代星”探しが加速

とりわけ重要視されているのが、銀河考古学（Galactic archaeology）です。天の川銀河の初期形成や、過去の合体・衝突の歴史を調べるには、極端に金属量の少ない（重元素が少ない）古い恒星など、非常に希少な対象を大規模データから効率よく見つける必要があります。

SpecCLIPが「異なる観測の壁」をまたいで探索できるようになると、希少天体を拾い上げるルートが増え、研究のスピードと解像度が上がることが期待されます。

応用例：地球に似た惑星探しでも、母星の特徴づけに活用

報道によれば、SpecCLIPはすでに複数の最先端ミッションに適用されています。たとえば地球に似た惑星の探索では、惑星を持つ恒星（母星）の特徴を高精度に評価し、居住可能性のある候補のスクリーニング効率を高めたとされています。

今後の見どころ：データ統合の主戦場は「AIが橋を架ける」領域へ

研究成果は学術誌「The Astrophysical Journal」に掲載されたとされます。観測装置が増え、サーベイが大型化するほど、天文学は“データの統合”が研究の中核になります。SpecCLIPのような枠組みは、装置や国・機関を超えてデータがつながる時代に、分析の入口そのものを作り替えていく存在になりそうです。