NVIDIA の Kaggle Grandmaster たち

Kaggle Grandmasters of NVIDIA (KGMoN) たちが、NVIDIA によって加速されたデータ サイエンスを、勝利したレコメンダー システムの構築、RNA 分子の分解率の予測、医用画像におけるメラノーマの特定などにどのように利用したかをご紹介します。

KGMoN チームの紹介

Bo Liu

Bo Liu

NVIDIA シニア データ サイエンティスト

Chris Deotte

Chris Deotte

NVIDIA シニア データ サイエンティスト

Christof Henkel

Christof Henkel

NVIDIA データ サイエンティスト

Dave Austin

David Austin

NVIDIA システム ソフトウェア プリンシパル エンジニア

Gilberto Titericz

Gilberto Titericz

NVIDIA データ サイエンティスト

Jean-Francois Puget

Jean-Francois Puget

NVIDIA の名誉エンジニア

Jiwei Liu

Jiwei Liu

NVIDIA シニア データ サイエンティスト

Kazuki Onodera

Kazuki Onodera

NVIDIA シニア データ サイエンティスト

Théo Viel

Théo Viel

NVIDIA ディープラーニング シニア データ サイエンティスト

KGMoN チームの最近のコンペティションでの活躍

NLP ダウンストリーム タスクのための DeBERTa の台頭

2022 年 3 月と 5 月

NLP ダウンストリーム タスクのための DeBERTa の台頭


2 つの異なる大会で、チームは自然言語処理を使用して学生の論述を分析し、医師免許試験の患者ノートで重要なフレーズを特定しました。

Recommender Systems Challenge

2021 年 6 月

RecSys Challenge


NVIDIA Merlin と KGMON のチームが RecSys Challenge 2021 で 1 位を獲得しました。数百万件のデータセットで、ユーザーのエンゲージメントの確率を効果的に予測しました。

Booking.com の旅行先推奨に挑戦

2021 年 3 月

Booking.com Web Search and Data Mining (WSDM) WebTour 2021 Challenge


このレコメンデーション システム課題の目標は、匿名化された無数の宿泊予約 (実際の宿泊予約) に基づくデータセットを利用し、リアルタイムで次のベスト旅行先を推奨する戦略を考えることです。

Transformer と Hugging Face で世界最高レベルの NLP モデルを構築する

2021 年 3 月

Transformer と Hugging Face で世界最高レベルの NLP モデルを構築する


このビデオでは、自然言語処理の歴史の簡単な紹介と現状、また、4 つの異なるコンペティションで Hugging Face の Transformers を使用するためのベスト プラクティスも紹介しています。

COVID-19 mRNA ワクチン分解予測コンテスト

2020 年 10 月

OpenVaccine: COVID-19 mRNA ワクチン分解予測


この競技では、機械学習モデルを開発し、RNA 劣化法則を考案するという課題がチームに与えられました。このモデルでは RNA 分子のベースごとに考えられる分解率を予測する必要があり、3000 超の RNA 分子 (無数の配列と構造がある) と各位置の分解率からなる Eterna データセットのサブセットでトレーニングしました。

Google Landmark Recognition 2020

2020 年 9 月

Google Landmark Recognition 2020


このランドマーク レコグニション チャレンジでは、複雑なテスト画像からなるデータセットの中に正しいランドマークがあればそれを認識するモデルを構築するという課題がチームに与えられました。これは「言うは易く行うは難し」です。ランドマーク レコグニションには、大量のクラスが含まれます。たとえば、このコンテストではクラスの数が 81,000 以上ありました。

SIIM-ISIC 黒色腫分類

2020 年 8 月

SIIM-ISIC 黒色腫分類


このコンテストでは、患者の画像から皮膚病変を特定し、黒色腫を示す可能性が最も高い画像を判断する ML モデルを作成するという課題がチームに与えられました。賞を得た ML モデルでは、平均的な皮膚科医よりも早期かつ正確に黒色腫を同定することができました。

データ サイエンス グランドマスター シリーズ

「Grandmaster Series」は、データ サイエンティストのための月刊教育ビデオ シリーズです。各エピソードで、データ サイエンスの世界を牽引するエキスパートたちがその考え、ベスト プラクティス、最近の大会から得られた重要な学びについてご紹介します。是非視聴して、エキスパートたちが学んだことを自身のデータ サイエンスの課題の応用にお役立てください。

登録し、データ サイエンス関連のニュースを受け取る