古代人のDNA分析に関する基礎知識のおさらい:さすがに何も知らずに語れないよな?
最近は考古学論文でもDNAとかゲノムとかいう言葉が飛び交うようになってきている。
で、古代のDNAを分析する場合に覚えておいたほうがいい基礎があるので、ちょっと復習も兼ねてまとめておくことにした。
まず、よく出てくる「DNA」とか「ゲノム」とかの言葉の違いについては ザックリ以下で認識しておけばだいたい間違いはない。
遺伝子は現在は働いていない未使用データ抜きの部分なので、古代人のDNAを解析~とか言ってる時は未使用データ込みで分析されていると考えればOK。未使用の部分もDNAとして親から遺伝されるので、ここを調べると祖先が分かる。IT用語で喩えると、コメントアウトされている履歴を見ればどのブランチからコミットされてきたソースかが分かる。
DNA=デオキシリボ核酸で出来た設計図、二重らせんの鎖のこと
ゲノム=DNAの文字列に表された遺伝情報すべて(※進化の過程で蓄積した未使用データも含む)
遺伝子=DNAからタンパク質に翻訳された領域(※未使用データ抜きに実際に働いてる部分)
で、次に高校で習った、以下の4種類を思い出してほしい。これがDNAを構成する要素のすべて。分析されて出てくるものはこの4種類がひたすら並んだ文字列。
アデニン(A)、チミン(T)、グアニン(G)、シトシン(C)
アデニンはグアニンとのみ結合し、チミンはシトシンとのみ結合する。
つまりDNAが損傷していても、相方が分かっている欠損ならばもう片方は修復できる。ただし、DNAの欠損の仕方は色々ある。
以下のページに主要なDNA損傷の種類が紹介されているが、古代のDNA/ゲノム解析の論文で見かけるパターンはだいたい網羅されている。
失われた塩基対:DNA損傷
https://www.ptglab.co.jp/news/blog/missing-pieces-dna-damage/
1. 酸化:
2. 加水分解:
A. 脱アミノ化
B. 脱プリン化
3. ピリミジン二量体:
4. ミスマッチ塩基:
5. 一本鎖切断(SSB:single strand breaks):
6. 二本鎖切断(DSB:double strand breaks):
特定の文字列が勝手に置き換わってしまう現象の場合は、それをもとに戻すことでなんとかなる場合がある。が、欠損が複数パターン同時に同じ箇所に起きるなどしていた場合、修復しきれないことは考えられる。

ちょっと古い論文だが、以下に古代DNAに起きやすい損傷パターンがまとまっている。
Ancient DNA Damage
https://pmc.ncbi.nlm.nih.gov/articles/PMC3685887/
ネアンデルタール人のDNAでは脱プリン化が多く起きている可能性が高いらしい。また永久凍土から出てきた遺物では保存はいいが鎖が切れ切れになっていることが多いという。湿度や土壌のphなど、環境によって起きやすい損傷が異なる可能性もあるという。
いずれにせよ、古代のDNAは例外なく鎖が切れたり文字列が変わってしまったり欠損したりで細切れなので、修復精度によって読める量は異なる。
次世代シーケンサーと呼ばれる分析技術も第三世代あたりまでの話は見かけたことがある。技術の進化が速くトレンドも変わっていくが、基本事項は変わらないので、まずそこから押さえていくと、大雑把な内容はなんとなく分かるようになると思う。
つうかまあ、高校の生物でやった内容が普遍の基礎なんで、そこ押さえとくだけでも5割くらい分かるんでは…。
あと次世代シーケンサーの仕組み解説ページとか。
専門家が作ってるページっぽく、動画も載ってるので、「DNAを短くぶった切って読み込んで順番入れ替える」というやり方の詳細はここで確認するといいかと。
https://foodmicrob.com/dna-sequencers-princiiple/

というわけで、なんとなく知っとくとこれで論文読めるようになるよ。という基礎知識でした。
「DNAとかわっかんない、考古学は文系なんだからDNAとかの理系ジャンルは知らないでいいでしょ…」とかは、もう言ってられる時代じゃないのです。そんな難しくないよ!
*****
[>おまけ
「古代エジプト人の全ゲノム特定」の論文が意味するところ/古代人のゲノム研究はカバレッジが低いという前提について
https://55096962.seesaa.net/article/516732615.html
で、古代のDNAを分析する場合に覚えておいたほうがいい基礎があるので、ちょっと復習も兼ねてまとめておくことにした。
まず、よく出てくる「DNA」とか「ゲノム」とかの言葉の違いについては ザックリ以下で認識しておけばだいたい間違いはない。
遺伝子は現在は働いていない未使用データ抜きの部分なので、古代人のDNAを解析~とか言ってる時は未使用データ込みで分析されていると考えればOK。未使用の部分もDNAとして親から遺伝されるので、ここを調べると祖先が分かる。IT用語で喩えると、コメントアウトされている履歴を見ればどのブランチからコミットされてきたソースかが分かる。
DNA=デオキシリボ核酸で出来た設計図、二重らせんの鎖のこと
ゲノム=DNAの文字列に表された遺伝情報すべて(※進化の過程で蓄積した未使用データも含む)
遺伝子=DNAからタンパク質に翻訳された領域(※未使用データ抜きに実際に働いてる部分)
で、次に高校で習った、以下の4種類を思い出してほしい。これがDNAを構成する要素のすべて。分析されて出てくるものはこの4種類がひたすら並んだ文字列。
アデニン(A)、チミン(T)、グアニン(G)、シトシン(C)
アデニンはグアニンとのみ結合し、チミンはシトシンとのみ結合する。
つまりDNAが損傷していても、相方が分かっている欠損ならばもう片方は修復できる。ただし、DNAの欠損の仕方は色々ある。
以下のページに主要なDNA損傷の種類が紹介されているが、古代のDNA/ゲノム解析の論文で見かけるパターンはだいたい網羅されている。
失われた塩基対:DNA損傷
https://www.ptglab.co.jp/news/blog/missing-pieces-dna-damage/
1. 酸化:
2. 加水分解:
A. 脱アミノ化
B. 脱プリン化
3. ピリミジン二量体:
4. ミスマッチ塩基:
5. 一本鎖切断(SSB:single strand breaks):
6. 二本鎖切断(DSB:double strand breaks):
特定の文字列が勝手に置き換わってしまう現象の場合は、それをもとに戻すことでなんとかなる場合がある。が、欠損が複数パターン同時に同じ箇所に起きるなどしていた場合、修復しきれないことは考えられる。
ちょっと古い論文だが、以下に古代DNAに起きやすい損傷パターンがまとまっている。
Ancient DNA Damage
https://pmc.ncbi.nlm.nih.gov/articles/PMC3685887/
ネアンデルタール人のDNAでは脱プリン化が多く起きている可能性が高いらしい。また永久凍土から出てきた遺物では保存はいいが鎖が切れ切れになっていることが多いという。湿度や土壌のphなど、環境によって起きやすい損傷が異なる可能性もあるという。
いずれにせよ、古代のDNAは例外なく鎖が切れたり文字列が変わってしまったり欠損したりで細切れなので、修復精度によって読める量は異なる。
次世代シーケンサーと呼ばれる分析技術も第三世代あたりまでの話は見かけたことがある。技術の進化が速くトレンドも変わっていくが、基本事項は変わらないので、まずそこから押さえていくと、大雑把な内容はなんとなく分かるようになると思う。
つうかまあ、高校の生物でやった内容が普遍の基礎なんで、そこ押さえとくだけでも5割くらい分かるんでは…。
あと次世代シーケンサーの仕組み解説ページとか。
専門家が作ってるページっぽく、動画も載ってるので、「DNAを短くぶった切って読み込んで順番入れ替える」というやり方の詳細はここで確認するといいかと。
https://foodmicrob.com/dna-sequencers-princiiple/
というわけで、なんとなく知っとくとこれで論文読めるようになるよ。という基礎知識でした。
「DNAとかわっかんない、考古学は文系なんだからDNAとかの理系ジャンルは知らないでいいでしょ…」とかは、もう言ってられる時代じゃないのです。そんな難しくないよ!
*****
[>おまけ
「古代エジプト人の全ゲノム特定」の論文が意味するところ/古代人のゲノム研究はカバレッジが低いという前提について
https://55096962.seesaa.net/article/516732615.html