SatAI.challenge
@sataichallenge
SatAI.challengeは、リモートセンシング技術にAIを適用した論文の調査や、より俯瞰した技術トレンドの調査や国際学会のメタサーベイを行う勉強会コミュニティです。
人工衛星×種生息地×説明文のデータセットを作成したEcoWikiRSを紹介しました。画像と文章を重み付きinfoNCE損失で既存のCLIP等のVLMにファインチューニングさせる形で生態系情報を学習。 より精度が上がればこの渡り鳥って〇〇国にも行ってるの!?という AI推論から現実にフィードバックできるかも?
EcoWikiRS: Learning Ecological Representation of Satellite Images from Weak Supervision with Species Observation and Wikipedia speakerdeck.com/satai/ecowikir… 航空画像と位置情報付き種観測データとWikipedia生息地記述文を組み合わせ、弱教師ありで環境性質をモデル学習します。
第15回 SatAI.challenge勉強会で、リモートセンシング画像から画像エンコーダとマルチモーダルLLMを用いてベクトル形式で建物を抽出する論文を紹介しました 学習していない建物以外の地物の輪郭も抽出できるなど、これからの発展に期待したいなと思いました arxiv.org/abs/2507.04664
VectorLLM: Human-like Extraction of Structured Building Contours via Multimodal LLMs speakerdeck.com/satai/vectorll… 人間が建物の輪郭を描くときと同様に建物の角を見つけ輪郭を描く手法を、画像のエンコーダとマルチモーダル大規模言語モデルを用いて提案しています。
リモートセンシングx世界モデルでヒットした論文を読みましたが、拡散モデルで水増しする話でした🙄 世界モデルかはさておき、前の出力を再入力するカスケード型の拡散モデルと、推論時のスライディング窓を重複部分のノイズを同じにする工夫は他の手法でも有用になるはずです。
MetaEarth: A Generative Foundation Model for Global-Scale Remote Sensing Image Generation speakerdeck.com/satai/metaeart… データの水増しを行うために、拡散モデルを使って様々な解像度の光学衛星画像生成を行う手法です。カスケード型の層設計と、推論時のガウシアンノイズの与え方を工夫しています
CVPR'25に投稿されたリモートセンシング画像のためのOpen vocabulary segmentationの手法に紹介しています! CVからリモセンへモデルを持ってきた際の限界点、セマセグマスクの予測方法などの要素技術の解説も行っています!
SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images speakerdeck.com/satai/segearth… Open-Vocabulary Semantic SegmentationのCLIPベースの手法の特徴量マップの解像度を小さくしすぎている点に着目し、その特徴マップを高解像度化するSimFeatUpという手法を提案
衛星画像からの3次元復元に3D Gaussian Splattingを使った論文を紹介しました ぜひご覧ください〜
EOGS: Gaussian Splatting for Efficient Satellite Image Photogrammetry 非同時撮影の複数衛星画像を用いたDSM作成に3DGSを用いることで、NeRFよりも大幅な計算量削減が可能な手法を提案しました。 speakerdeck.com/satai/eogs-gau…
📢SatAI.challenge で実施してきたリモートセンシング×AI勉強会のスライドをまとめています! 🌏 衛星画像解析 / マルチモーダル融合 / 最先端論文レビュー など盛りだくさん。 ぜひご覧ください👇 staff.aist.go.jp/shinohara.taka… #RemoteSensing #AI #リモートセンシング