Tatsuya Suzuki
@x_ttyszk
AIがんばってます
執筆参加した「Data-centric AI入門」本日1/8発売です!DCAIの概要からはじまり、画像・LLM・ロボットと幅広くデータに関する話が整理されています。私は最後のData-centric AIの実践例の章担当し、様ざまな面白い事例紹介させていただきました!ぜひご覧ください。 gihyo.jp/book/2025/978-…
SAM2の活用や最近の動向について話します!
\🚀8/5 開催 DeNA × AI Talks #1🚀/ DeNAが新しいAIイベントをはじめます🎉 初回は「AIスペシャリストが語る、最新技術」と題して、LLMや画像認識分野における最新動向を中心に、現場のリアルな視点を交えたセッションをお届けします🙌 dena.connpass.com/event/362260/
MIRU毎日いるので参加される方よろしくお願いします
/ 🔥#MIRU2025 に出展します!🔥 \ 画像の認識・理解シンポジウム(#MIRU2025)にてDeNA x AI メンバーが企業ブースに出展します! スポーツやライブ配信サービスでの画像認識技術に触れられるデモやポスターを展示予定です✨️ ぜひお越しください! dena.ai/news/MIRU2025/
\🚀8/5 開催 DeNA × AI Talks #1🚀/ DeNAが新しいAIイベントをはじめます🎉 初回は「AIスペシャリストが語る、最新技術」と題して、LLMや画像認識分野における最新動向を中心に、現場のリアルな視点を交えたセッションをお届けします🙌 dena.connpass.com/event/362260/
LLMやSAM2の面白い話する勉強会やります!司会で当日会場いるので渋谷オフィス遊びに来てください!
\🚀8/5 開催 DeNA × AI Talks #1🚀/ DeNAが新しいAIイベントをはじめます🎉 初回は「AIスペシャリストが語る、最新技術」と題して、LLMや画像認識分野における最新動向を中心に、現場のリアルな視点を交えたセッションをお届けします🙌 dena.connpass.com/event/362260/
Next-level referring expression segmentation with Gemini 2.5 🤯
Gemini 2.5 introduces conversational image segmentation for AI, enabling advanced visual understanding through object relationships, conditional logic, and in-image text. developers.googleblog.com/en/conversatio…
Gemini 2.5 introduces conversational image segmentation for AI, enabling advanced visual understanding through object relationships, conditional logic, and in-image text. developers.googleblog.com/en/conversatio…
🔥 26卒本選考まだまだ募集中 🔥 AI人材のキャリアは一本道じゃない🪐 MLOpsへ転身してシステム開発力を伸ばす人もいれば、 プロダクトマネジメントのスキルを軸にするなど、 AIの専門性を活かした“幅広いキャリア“を自らの意思で実現できます。 詳細はこちら👇 dena.snar.jp/index.aspx
Kaggle IMCコンペの解説資料を公開しました ざっくり入口的な資料として読んで貰えれば嬉しいです〜 docswell.com/s/7056084/K7EP…
本日の発表資料です!もう出来てる! speakerdeck.com/peisuke/vggt-v… #cvsaisentan
はてなブログに投稿しました 2025/07/13第64回CV勉強会@関東「CVPR2025読み会」(前編)資料まとめ - takminの書きっぱなし備忘録 @はてなブログ takmin.hatenablog.com/entry/2025/07/… #cvsaisentan
必見な論文です
ResNet 系は背景情報に過学習しがちだけど、ViT 系はそういった傾向は軽減されている話について、ちゃんと分析してる論文 #cvsaisentan [2201.10766] A Comprehensive Study of Image Classification Model Sensitivity to Foregrounds, Backgrounds, and Visual Attributes arxiv.org/abs/2201.10766
Molmo and Pixmo, ・訓練を受けていないアノテータから高品質なデータを集めるには? というモチベーションが背景となっている部分が、かなりMLOpsの本質的な課題意識を感じて素敵ですね arxiv.org/abs/2409.17146 #cvsaisentan
最初のご発表はshade-tree様で"Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models"です。 #cvsaisentan
始まります。まずはオープニングです。配信も開始しました。 youtube.com/live/Dt1D4kCdU… #cvsaisentan
音楽からギターやボーカルなどの楽器演奏を分離するSCNetの論文を社内の勉強会で紹介しました!モデルの詳細や、そこでの音の聴こえ方、評価指標の計算法など丁寧に解説しています。もしよければご覧ください! #論文紹介 speakerdeck.com/kenmatsu4/lun-…
🏭️EVERSTEELで「鉄スクラップ x CV」というニッチ領域の現状を紹介する記事を書きました! 分野の全体観と、軽く論文紹介しています。 さっくり読める内容となってますので、よかったらご覧ください🙏 zenn.dev/eversteel_tech…
🚀#26卒 本選考まだまだ募集中 🚀 AIスペシャリストの仕事は、単にモデルを作ることじゃない🔥 事業企画から開発・運用まで、データエンジニアやMLOpsエンジニアと連携しつつ、必要に応じてマーケ・CS・法務まで巻き込んで推進します。 #26卒本選考 #データサイエンティスト #AI 詳細はこちら👇…