ゲノムの違いを読み解くゲノム変異解析とはどんな解析?
こんにちは、バイオインフォマティシャンの今井です。
プラチナバイオ株式会社では、バイオインフォマティクスを利用した標的遺伝子の特定、ゲノム編集、ゲノム編集後の解析までを一気通貫で行い、顧客の目的の表現型を構築する研究開発を進めています。
これまで当社note記事では、新規ゲノム情報を取得するde novo assembly、そして構築されたゲノム配列から遺伝子となりうる領域を予測し、その機能予測する遺伝子機能アノテーションについてご紹介しています。
構築されたゲノム情報は基準ゲノムとして利用できるようになり、ゲノム育種や創薬開発にも応用可能となります。
本記事では、ある個体や品種がもつユニークな特徴、病気や形質に関わる可能性のある遺伝子の違いを基準ゲノムとの違い(変異)として検出するゲノム変異解析(Variant Calling)について解説します。
1. リード取得とマッピング
まず注目する個体や品種由来のシーケンスリード(ATGCからなる配列情報)を取得します。次に、そのリードを基準ゲノム上のどこに対応するか探し出しながら並べる作業(マッピング)を行います。
これにより、注目するゲノムの配列と基準配列を比較して「変異」を見つけ出す準備が整います。
2. 変異解析
マッピングの結果を利用して、基準ゲノムと異なる部分(変異)を検出します。これが変異解析です。
どの領域(遺伝子等)でどのような変異があるかを精査することで、品種改良や創薬開発の鍵となる変異情報を取得できます。
3. 主な変異の種類
SNV(Single Nucleotide Variant; 一塩基バリアント)
塩基配列の1つの塩基が置き換わる変異です。3つの塩基から構成されるアミノ酸(注)の変化(置換)を起こす変異である場合、タンパク質の機能が変化することがあります。SNVを利用して優良個体の選抜を目指したゲノム選抜プログラムも盛んに行われています。(参考1)
(注)ゲノム配列はATGCの4塩基で構成され、タンパク質をコードする部分では3つの塩基(コドン)が1つのアミノ酸に対応します。コドンは64種類あり、20種類のアミノ酸を指定し、一部は翻訳の終止信号として機能します。
INS(Insersion; 挿入変異)
塩基配列の途中に余分な塩基が入り込む変異です。数塩基〜数十塩基程度の小さな変異です。アミノ酸配列にも変化をもたらして、正常なタンパク質が作られなくなることがあります。
DEL(Deletion; 欠失変異)
本来あるはずの塩基配列が欠けてしまう変異です。挿入変異と同じく、数塩基〜数十塩基程度の小さな変異です。挿入変異とまとめてINDEL(インデル)と分類されることもあります。遺伝子の一部が失われて、機能喪失を引き起こすことがあります。
SV(Structural Variant; 構造変異)
数百〜数百万塩基規模で起こる塩基配列の大きな変化を指します。大規模な挿入・欠失も構造変異や、染色体の一部が逆向きになる反転や他の染色体に移動する転座が含まれます。
このような大規模な変異は病気や生物の進化に関与することが知られています。(参考2, 3)

参考文献
1. https://doi.org/10.1016/j.aquaculture.2021.737671
2. https://doi.org/10.1073/pnas.2300673120
3. https://doi.org/10.1016/j.cell.2020.05.021
ゲノム変異解析で得られる情報は、単にDNA配列の違いを知るだけにとどまりません。病気の原因や新しい治療法の探索、さらには農作物や家畜の品種改良といった応用へとつながります。SNVやINDELのような小さな変異から、SVに代表される大規模な構造変異までを包括的に把握することで、生命の多様性や適応の仕組みを解き明かし、実社会で役立つ技術へと発展させることが可能になります。
おわりに
当社では、品種間比較や優良品種の選抜等を目指したゲノム変異解析サービスを提供しています。解析の進め方や具体的な応用についてもご相談を承っておりますので、ご興味をお持ちの方は、お気軽に資料請求・お問い合わせ(https://www.pt-bio.com/)よりご連絡ください。
作成者:今井 美沙子 / Misako IMAI, Ph.D.
2022年入社。博士(生命科学)。
大学の技術職員としてバイオインフォマティシャンのキャリアをスタート。現在はプラチナバイオ株式会社研究開発部 バイオインフォマティシャンとして、さまざまな生物のゲノム解析を担当。
どんな人にもわかりやすくをモットーに、ゲノム解析のあれこれについて発信していきます。
