東京大学-DSTEP(Data Scientist Training/Education Program) 東京大学-DSTEP(Data Scientist Training/Education Program)
東京大学-DSTEP(Data Scientist Training/Education Program)
 近年次世代シーケンサーに代表されるハイスループット機器解析の発達により急速に集積する医療ゲノム関連バイオビッグデータを活用した高度データ解析を必要とする課題に即応できる人材は、アカデミアのみならず、関連産業分野の企業でも不足しており、課題解決能力の備わる高度な人材の発掘・育成や、企業研究者の再教育を促進する仕組みを創出することは喫緊の課題となっています。

 DSTEP (Data Scientist Training/Education Program)では、大学組織の外に置かれた、製薬、バイオインフォマティックス、バイオテクノロジー関連企業からなるコンソーシアムや、学内運営機関として設置された社会連携講座との連携により、企業ニーズに直結するバイオインフォマティクス上の実践的な問題設定について、その問題解決に即戦力となる人材の育成を目的としております。

また本プログラムに賛同いただける企業様を随時募集しております。
下記宛までご連絡いただけますと幸いです。

〒277-8562 
千葉県柏市柏の葉5-1-5 
東京大学柏キャンパス 情報生命科学実験棟
電話番号 : 080-3565-9297
メール:dstep{}edu.k.u-tokyo.ac.jp

*{}部分には@を入れてください。

 近年次世代シーケンサーに代表されるハイスループット機器解析の発達により急速に集積する医療ゲノム関連バイオビッグデータを活用した高度データ解析を必要とする課題に即応できる人材は、アカデミアのみならず、関連産業分野の企業でも不足しており、課題解決能力の備わる高度な人材の発掘・育成や、企業研究者の再教育を促進する仕組みを創出することは喫緊の課題となっています。

 DSTEP (Data Scientist Training/Education Program)では、大学組織の外に置かれた、製薬、バイオインフォマティックス、バイオテクノロジー関連企業からなるコンソーシアムや、学内運営機関として設置された社会連携講座との連携により、企業ニーズに直結するバイオインフォマティクス上の実践的な問題設定について、その問題解決に即戦力となる人材の育成を目的としております。

また本プログラムに賛同いただける企業様を随時募集しております。
下記宛までご連絡いただけますと幸いです。

〒277-8562 
千葉県柏市柏の葉5-1-5 
東京大学柏キャンパス 生命棟3F 301号室
電話番号 : 04-7136-3711
メール:dstep@hgc.jp

お知らせ一覧

プログラム概要

プログラム修了要件

・DSTEP-B (生物背景)
必修科目「データサイエンス実践演習Ⅰ~Ⅲ」に加えて「バイオデータプログラミング演習Ⅰ」を必修とし、選択必修科目より4単位(計8単位)履修する。本学の情報系科目をDSTEP選択科目に振替えることができる。
・DSTEP-I (情報背景)
必修科目「データサイエンス実践演習Ⅰ~Ⅲ」に加えて「バイオデータプログラミング演習Ⅰ」および「バイオデータプログラミング演習Ⅱ」を必修とし、両専攻が指定する基礎医科学・生物系科目群から2科目を(計7単位)履修する。

科目の内容・特色

1.「バイオ機能情報解析学」

大規模生命データを駆使した最先端研究をわかりやすく俯瞰する。

授業テーマ
第一回 システム生物学・難病
第二回 コホート
第三回 ウイルス・血液腫瘍
第四回 疾患(精神神経・がん)

2.「創薬データサイエンス概論」

次世代シークエンサー解析の方法論等、初等的な基礎について解説する。
授業内容
1.ゲノム
2.GWAS
3.エピゲノム
4.データベース
5.トランスクリプトーム
6.メタゲノム
7.シングルセル+空間オミクス
8.ロングリード

3.「バイオデータプログラミング演習I」

必要に迫られてプログラミングを書籍で独学すると基礎知識の不足に悩むことが多い。
本演習ではそのような学生が過去に躓いたポイントを調べ、必要な基礎知識を大量に補った独自のオンラインプログラミング学習教材を作成した。
生物学・医科学のプログラミングに必要な概念をゼロから広く浅く学び、研究に必要な高度なプログラミングを将来的に独学できるような「基礎体力」を養う。
初学者は大量の自習が必要である。

4.「バイオデータプログラミング演習II」

先駆的に開発され試用が開始されている情報解析ツール群を用い、その利用法について、実データを用いた実践的演習形式で習熟する。
生物学的に解析意義をもった実データに対して、データの抽出と解釈、それぞれの目的に即した考慮条件およびパラメーター等の解析条件を最適化する手法を習得する。

5.「創薬データサイエンス演習」

企業へのインターンシップ、若手研究会への参加、医療機関における医療現場のデータ処理を実地に体験する演習を実施する。
のべ4日間程度にわたり履修学生を派遣し、短期的課題をこなす演習形式で行う。
※2020~2022年度はオンラインで実施

6.「データサイエンス実践演習I-III」

I~IIIは、履修開始一年次から三年次までの各年度の必修科目として設定され、提案課題の採用のための評価(I)や進捗度合い(II,III)を筆記試験、口頭試問としてそれぞれ合否判定する(Qualifying Examination(QE)として機能する)。

プログラムコア科目

科 目 名 単位
1 バイオ機能情報解析学 1
2 創薬データサイエンス概論 1
3 バイオデータプログラミング演習I 1
4 バイオデータプログラミング演習II 1
5 創薬データサイエンス演習 1
6 ドラッグデザイン特論 2
7 データサイエンス実践演習I 1
8 データサイエンス実践演習II 1
9 データサイエンス実践演習III 1

授業詳細

創薬データサイエンス概論(A1A2ターム、集中、木金4、5限)

担当教員: 鈴木 穣・片山 量平・関 真秀・鈴木 絢子
場所: Zoom開催

日程 授業内容(予定) 講師
2023/10/26(木) 1.ゲノム
2.GWAS
菊地 正隆
鎌谷 洋一郎
10/27(金) 3.エピゲノム
4.データベース
鈴木 絢子
山下 理宇
11/2(木) 5.トランスクリプトーム
6.メタゲノム
関 真秀
木口 悠也
11/9(木) 7.シングルセル+空間オミクス
8.ロングリード
鹿島 幸恵
関 真秀
創薬データサイエンス演習(A1A2ターム、金3-5限)

担当教員: 鈴木 穣・片山 量平・関 真秀・鈴木 絢子
場所: 場所により、オンサイト開催もしくはZoom開催。詳しくはUTASをご確認ください。

日程 授業場所 講師
2023/11/24(金) がん研究会有明病院(オンライン予定) 冨田 章弘
片山 量平
12/1(金) NBDC 五斗 進
12/15(金) 東京大学医科学研究所 山下 理宇
朴 聖俊
中井 謙太
12/22(金) 国立がん研究センターEPOC 山下 理宇
バイオ機能情報解析学(A2ターム、火4,5限)

担当教員: 鈴木 穣・関 真秀・鈴木 絢子
場所: Zoom開催

日程・テーマ 授業内容・タイトル 講師
12/5(火)
第一回
システム生物学・難病
「深層生成モデルがつなぐ一細胞の状態と多様な生命現象」 小嶋 泰弘
(国立がん研究センター)
「遺伝性疾患のゲノム解析」 河合 洋介
(国立国際医療研究センター)
12/12(火)
第二回
コホート
「ToMMoが実施する前向きゲノムコホートの進捗」 勝岡 史城
(東北大学 東北メディカル・メガバンク機構)
「がんゲノム医療と新規治療開発の展望​」 土原 一哉
(国立がん研究センター 先端医療開発センター)
12/19(火)
第三回
ウイルス・血液腫瘍
「感染症、がんを対象としたマルチオミクス解析と治療薬開発」 山岸 誠
(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 病態医療科学分野)
「オミクス解析技術を活かした血液がんの病態研究」 坂田(柳元) 麻実子
(筑波大医学医療系)
12/26(火)
第四回
疾患(精神神経・がん)
「精神疾患モデル動物研究の現在」 森 大輔
(名古屋大学脳とこころの研究センター)
「マルチオミクス解析によるMSI-H大腸癌の癌微小環境の解明」 三森 功士・巽 孝成
(九州大学病院別府病院)
バイオデータプログラミング演習I(S1ターム、水3, 4限)

担当教員: 笠原雅弘
日程: 2023/4/5、4/19、4/26、5/10、5/17、5/24、5/31
時間: 3限(13:15-14:45)、4限(15:10-16:40)
場所: zoomによるオンライン講義

内容
1 初回チュートリアル / プログラミング言語の分類と選択 / エディタの基本的な使い方
2 コンピューターの基本的な仕組み / UNIXコマンドライン / ソフトウェアのインストール方法
3 Pythonの基本制御構造・関数 / Pythonのクラス / 文字列処理 / PythonでCSV/TSVファイルを処理
4 正規表現 / JSONとXML
5 PythonのモジュールとPyPI / 関係データベースとSQL
6 Rの変数・基本制御構造と関数 / Rのリスト・行列 / 整然データ
7 集計とグラフ描画 / 統計検定
8 Rのパッケージ / Bioconductorの紹介 / Jupyter
9 バージョン管理
10 テストと継続的インテグレーション
11 SSHと遠隔サーバーの使い方 / 分散ファイルシステム
12 バッチジョブキューシステム
13 ワークフローと再現性
14 復習と試験(最終実技試験は5月以降いつでも受けることができる)

バイオデータプログラミング演習II(A2ターム、木4・5限)

担当教員: 関 真秀・鈴木 絢子・中谷 明弘・鹿島 幸恵
場所: Zoom開催

日程(予定) 授業内容(予定) 備考
2023/11/30 1. 計算機環境の説明、オミクス解析準備
12/14 2. オミクス解析(トランスクリプトーム・エピゲノム)
12/21 3. ロングリード解析
2024/1/4 4. シングルセル解析 基礎
1/11 5. シングルセル解析 発展
1/18 6. GWAS
1/25 7. テスト

「科目等履修生」

コア科目[1-6]については新領域創成科学研究科の大学院科目等履修制度による学外履修が可能。
科目履修生の募集について

「プログラムアドバイザー制度」

プログラム履修生の学位論文研究指導は、指導教員による直接指導および、各専攻におけるアドバイザー制度などの学位取得支援制度を併用する。また、その他に1名以上のプログラムアドバイザーをプログラム運営委員会が指定する。

受講要件

プログラム修了要件

・DSTEP-B (生物背景)
必修科目「データサイエンス実践演習Ⅰ~Ⅲ」に加えて「バイオデータプログラミング演習Ⅰ」を必修とし、選択必修科目より4単位(計8単位)履修する。本学の情報系科目をDSTEP選択科目に振替えることができる。
・DSTEP-I (情報背景)
必修科目「データサイエンス実践演習Ⅰ~Ⅲ」に加えて「バイオデータプログラミング演習Ⅰ」および「バイオデータプログラミング演習Ⅱ」を必修とし、両専攻が指定する基礎医科学・生物系科目群から2科目を(計7単位)履修する。

受講資格

 生命科学研究系に入学した博士課程学生を対象とする。
 (専攻HPの受験要綱へ)

選抜方法

 プログラム履修生の募集は半期ごとにプログラム運営委員会が行い、提出された「学位研究課題提案書」に対する書面審査、また口頭試問によりプログラム履修を認定する。

イベント一覧

2023年度 第二回説明会 (Web)のお知らせ

課題公募の説明会を開催します

日時: 2023 年 10 月 16 日(月) 12:00~13:00
場所: Zoomによる開催

詳細はこちら

様式はこちら

2023年度 第一回説明会 (Web)のお知らせ

課題公募の説明会を開催します

日時: 2023 年 4 月 14 日(金) 12:00~13:00
場所: Zoomによる開催

詳細はこちら

様式はこちら

2022年度 第二回説明会 (Web)のお知らせ

課題公募の説明会を開催しました

日時: 2022 年 10 月 14 日(金) 12:00~13:00
場所: Zoomによる開催

詳細はこちら

様式はこちら

2022年度 第一回説明会 (Web)のお知らせ

課題公募の説明会を開催しました

日時: 2022 年 4 月 15 日(水) 12:00~13:00
場所: Zoomによる開催

詳細はこちら

様式はこちら

2021年度 第二回説明会 (Web) のお知らせ

課題公募の説明会を開催します

日時: 2021 年 10 月 20 日(水) 12:00~13:00
場所: Zoomによる開催

詳細はこちら

様式はこちら

2021年度 第一回説明会 (Web) のお知らせ

課題公募の説明会を開催します

日時: 2021 年 4 月 23 日(金) 12:00~13:00
場所: Zoomによる開催

詳細はこちら

様式はこちら

空間トランスクリプトーム解析【Visium】講習会

日時: 2021年 3月 10日 13:00~17:00
場所: Zoomによる開催

講習会ポスター

「DBTSS/DBKERO 講習会・シングルセル解析入門」のご案内

【イベントの趣旨】
SHIROKANEにより提供されている「転写開始点および疾患多層オーミクスデータベース DBTSS/DBKERO」 の利用説明会とDBKERO データを用いたシングルセル解析の入門講習を開催いたします。
本講習会は東京大学 鈴木 穣 教授 を講師に、大学院新領域創成科学研究科 生命データサイエンス教育プログラム DSTEP セミナーシリーズの一部としても行われます。

【スケジュール】
13:00 「1. 最近のオーミクスデータ産生のトピック」 (鈴木 穣)
13:30 「2. シングルセル解析、空間トランスクリプトーム解析の概略」 (鈴木 絢子)
14:10 「3. データベース DBTSS/DBKERO 講習会」 (鹿島 幸恵・若栗 浩幸)
14:30 「4. DBKERO シングルセル解析講習会」 (鹿島 幸恵・若栗 浩幸)
17:00 終了

【講習内容】
1. 最近のオーミクスデータ産生のトピック」では、最近の多層オーミクスデータ産生に関わる新規技術を幅広く紹介します。
2. シングルセル解析、空間トランスクリプトーム解析の概略」では、シングルセル解析や最近話題となっている空間トランスクリプトーム解析にフォーカスを置いて、その技術や情報解析手法についての概略を説明します。
3. データベース DBTSS/DBKERO 講習会」では、転写開始点および多層オーミクスデータベース DBTSS/DBKERO の利用講習会を実施します。Web ブラウザを用いてデータベースにアクセスし、ゲノム・エピゲノム・トランスクリプトームといった多層オーミクスデータ、および、シングルセル、ロングリードデータといった新規技術から得られたデータを実際に可視化し、その見方を学びます。
4. DBKERO シングルセル解析講習会」では、DBKERO に収載されているマウス肺のシングルセルデモデータを用いて、シングルセル解析の講習を実施します。SHIROKANE を用いて解析を行います。

  • 日程: 2020 年 12 月 9 日 (水)
  • 講義時間: 13 ~ 17 時
  • 会場: Webex によるオンライン開催
  • 定員: 100 名 (講習用ゲストアカウントによる受講 30 名、聴講のみ 70 名)
  • 対象: 多層オーミクスデータの活用・シングルセル解析に興味のある方。初学者歓迎
  • 参加費: 無料
  • 本講習会は日本語で実施します。
  • 本講習会では、30 名に講習用の SHIROKANE のゲストアカウントを用意し、このアカウントを用いて「4. DBKERO シングルセル解析講習会」の実習を行います。
    講習会進行の都合上、実習を希望する場合には、SHIROKANE のアカウントをお持ちであっても「講習用ゲストアカウントによる受講」を選択いただけますようお願いいたします。

【申込み方法】
下記 URL のフォームからお申込みください。後日 Webex の URL をご連絡します。
「講習用ゲストアカウントによる受講」、「聴講のみ」の 2 種類のチケットがあります。お間違えの無いようお気を付けください。
https://www.at.hgc.jp/event-details/dbtss-dbkero-koshukai-shinguruserukaisekinyumon-2

2020年度 第二回説明会 (Web) のお知らせ

課題公募の説明会を開催します

日時: 2020 年 10 月 13 日(火) 12:00~13:00
場所: Zoomによる開催

詳細はこちら

説明会資料(転載不可)

説明会動画
視聴にはパスワードが必要です。メールにてお問い合わせください。
宛先:dstep{}hgc.jp  *{}に@を入れてください。

過去のイベント

課題募集・各種書式

2023年度プログラム受講者(A群)を募集します(公募期間:2023年10月16日~2023年11月6日)

2023年度プログラム受講者(B群)を募集します(公募期間:2023年10月16日~2023年11月6日)

お問い合わせ ※フォーム停止中につき、メールにてお問い合わせください

    captcha

    Bitnami