「古代エジプト人の全ゲノム特定」の論文が意味するところ/古代人のゲノム研究はカバレッジが低いという前提について

古代エジプト人、それも紀元前2855~2570年という非常に古い時代の人骨からDNAが読み取れた、という論文が出ていた。
この年代が正しいなら初期王朝時代から古王国時代のはじめ頃にあたり、ピラミッド作ってる時代よりも前になる。古代エジプト王国成立まもない時代の遺伝的傾向が読み取れる重要な研究といえる。

この研究によると、分析されたDNAから、祖先の80%が北アフリカ集団に属していて、残り20%はレバントなどアジア系の可能性が高いという。他の研究でもっとあとの時代のミイラを調べたものでは、アジア系の祖先の数が著しく多いという結果が出ているので、今回分析されたその前の時代には、まだ移民はさほどいなかったのだろう。という結果になっている。
また、現代エジプト人の傾向から古代人との繋がりが想定されたり、祖先集団がかなりバラバラということも見えてきている。(※先行研究についてはこの記事の末尾にリンクあり。古代エジプト人のDNAに関する研究は今回のものが初めてではない)

これ自体は妥当な分析だと思うし、今まで古すぎて分析の出来なかった時代まで手を出せるようになったのは、純粋に技術の進歩すげーなと思うところだ。


ただし、古代人のDNA研究には、常に不確実性がつきまとう

・読み取れたという場合でも、欠落だらけの文字列を自動補完して穴埋めしたものを読み取っているので、穴埋めが正しいのかどうか分からん
・文字列に増幅をかけて読み取っているが、研究者の汗などの体液、空気中に含まれる微生物やカビなど現代の混入物のほうが増幅されやすい
・遺伝子の傾向を分析しようにも、他の地域の古代人のDNA情報も同様に不確実なものが多いため、仮データ同士を確率論で比較しているようなところがある

「全ゲノムの配列を決定した」という文字からは、DNAの全てが判明したような印象を受けがちだが、実際には穴開きパズルを仮で埋めて全体の絵を再現出来ました、くらいの意味。

というわけで、細かい説明はこれ系の研究してるプロに任せるとして、このブログでは、「この研究から分かること」「分からないこと」について最低限の補足説明をしておきたい。今の時代は考古学が趣味の人でもこのくらいは知ってないと話についていけないんで…。


*******

元論文
Whole-genome ancestry of an Old Kingdom Egyptian
https://www.nature.com/articles/s41586-025-09195-5

論文からリンクされていた補足資料
https://static-content.springer.com/esm/art:10.1038%2Fs41586-025-09195-5/MediaObjects/41586_2025_9195_MOESM1_ESM.pdf

今回の分析対象はエジプト中部のベニ・ハッサン近郊で1902年~1904年に発掘された遺体で、リバプール大学考古学研究所に寄贈されて保管されていたらしい。
こちらが発見時の写真。ツボに入った独特の埋葬方法は古い時代ならではのもの。まだ屈葬だし、死後の世界に関わる複雑な教義も無いシンプルな埋葬。ミイラ化技術も後の世に発展するので、この時代にはまだ、遺体はミイラというよりは骨である。

sfff8.png

ggg5.png


で、この論文の内容なのだが、最初に出てくる「2× coverage」という単語に注目してほしい。カバレッジとは何か。
これは、DNAを読み取れた回数のことだ。x2なら2回だけ。なんで何度も読み直すのか、だか、使われている解析手法として、ぶつ切りにしたDNAを一定の法則で増幅して読み取って解析するというやり方だからなのだ。
これは本に例えると、ページごとにバラして同時並行で読み込んでいる状態。頭から順番に読んでいく場合は時間がかかるが、こうしてバラバラにした部分ごとに読むことで解析を高速化しているのである。

ただし、バラバラにしているぶん順番が入れ替わるとか、前後関係がおかしくなるとか、サンプルが欠落して何ページか読み飛ばしてしまうとかもあり得る。そこで、バラし方を変えて何回か読み込み直し、最終的な結果を出すことになる。当然、読み込んだ回数が多いほど信頼度が高くなる。

現在の基準として、信頼度が高いとされるのはx30くらいからた。ということは、今回の論文のカバレッジはかなり低く、信頼度は低いと言える。注意すべき点として、全体カバレッジが高くても、ある領域は30回読み取れているのにある領域は2回だけ、とかで平均するとカバレッジは高いけど全体的な信頼度は低い、というケースもあるのだが、今回はそもそも全体としてx2なので、部分的に高いということもないのだろう。

そして、詳しくは以下の説明を見て欲しいのだが、回数が少ないと全体としての信頼度が低くなり、おおまかな傾向しか読み取れない。
この論文が、あまり細かい分析が出来ず大雑把な祖先集団の推定だけやっているのも、このカバレッジだとそこまでの分析が限界だからだと思う。

シーケンシング入門:シーケンスカバレッジ
https://www.pacb.com/japan/blog/sequencing-101-sequencing-coverage/

dgghh04.png

そしてもう一つ、欠損のあるDNAの増幅についても少し概念的な説明を入れておく。
詳しく知りたい人は次世代シーケンサーと呼ばれる塩基配列の決定技術について調べてみてほしいのだが、調べるのが面倒くさい人のために超ザックリそれっぽいイメージを説明する。
何をやっているかは、穴開きだらけの写真の全体図を再現するAIのようなものだというと少しイメージが付きやすいかもしれない。

たとえば、以下の写真を見て欲しい。Wikipediaから適当に拾ってきた写真だ。黒塗りの部分が、欠けている情報を意味している。

dfgg.png

AIに、ここを埋めて一枚の写真を再現するよう指示を出すと、足りない部分を推測して、着物を着た人間の形を作ってくれるだろう。着物の布地は、今見えている部分からの連続と想定し、一般的な着物の形のデータから全体は復元できる。
ただし、欠けが大きければ大きいほど、再現される絵は元のものからかけ離れてしまうし、もしかしたら毎回違った再現をしてしまうかもしれない。


ちなみに、こちらが元の写真である。
どうだろうか。黒塗りの時点で「座っている」こと、「かんざしが右側にもある」こと、着物の裏面の色は濃い紫であることまで予測できたエスパーはいるだろうか。

efghh.png


と、このように、自動的に情報を補った場合、このあたりの細かい情報、個性や個体差とでも言うべき部分は抜け落ちてしまう。
というか個体の遺伝的変異は配列中で1文字だけ違うとかのレベルのものもあるので、元からして欠落の多い古代人が相手では、そこまでの精度で読み取ることは出来ないのだ。
せめて、似たような写真が何枚もあり、欠損部分が少しずつ違っていれば、お互いの傾向を見て精度の高い穴埋めができるかもしれないが、今回のように一点モノの分析だとそれも出来ない。

結果、「着物の模様」や「かんざしの形状」のような細かい部分は確度が低いため論じることが出来ず、「おそらく日本人で、着物で着飾った女性」という、おおまかな属性のみが確実性の高い情報として分析対象となる。

上の「シーケンシング入門」にあるとおり、カバレッジが低い場合に論じられるのは集団の傾向などのみで、精度によって論じられる範囲に制限が出ることは重要なポイントかなと思う。


で、DNA情報は時間とともに壊れていくものなので、古代人の遺体から状態のいい情報が取れることはまず無い。つまり、考古学関連の研究で出てくる論文では、おのずと分析には限界があり、最初にも述べたとおり、出てきた結果については毎回必ず不確実性がつきまとう。
考古学関連の調査論文では、カバレッジがx1でも「全ゲノム配列決定」と言ってることがあるくらいなのだ。「新しい技術が出てきて、もいっかいゲノム読み直したら、この結果変わることもあるんじゃない?」くらい眉に唾をぬりぬりしながら読むくらいで丁度いいと思う。

ちなみに100年近く前の論文なんかを掘り出してきて読むと、血液型の分析やX線が最先端技術扱いで、そこで分析された内容が隠されていた真実の全てだくらいの勢いで説明されていたりする…。
技術の進歩は見える世界を変える。常識も覆ることがある。歴史は繰り返すのだ。


というわけで、古代人のDNA分析をもって歴史のすべてが明らかにされるようなことはないし、一つの研究で何かが覆ることもない。
ロマン詐欺に引っかからないためにも、こういう場合に行われている調査がどういうものなのかは知っておきたい。

**********

[>おまけ
古代エジプト人のDNAに関する論文を、以下にいくつか紹介しておく。

第18王朝近辺、ツタンカーメンを含む王家のDNA調査/Y染色体とミトコンドリアDNAのハプログループは西アジア系という話
https://55096962.seesaa.net/article/516048885.html

「緑のサハラ」に暮らした7,000年前の人骨のゲノム調査から、サハラ北部への外部影響が限定的だったことが明らかに
https://55096962.seesaa.net/article/514241785.html

「古代エジプト人のミイラの遺伝情報調べたら近東人に近かった!」→ちょっと違います
https://55096962.seesaa.net/article/201706article_1.html


ツタンカーメンのDNA分析というのも昔あったが、その時に書いたのが以下。

ツタンカーメンの親子鑑定DNA解析に見る問題点(1) STR検査法とその使い方
https://55096962.seesaa.net/article/201604article_20.html

ツタンカーメンの親子鑑定DNA解析に見る問題点(2) 科学の体裁を模した"解体ショー"
https://55096962.seesaa.net/article/201604article_23.html


古代人や歴史偉人に関するDNA分析について参考になりそうな本は以下。

王家の遺伝子 DNAが解き明かした世界史の謎 (ブルーバックス) - 石浦章一
王家の遺伝子 DNAが解き明かした世界史の謎 (ブルーバックス) - 石浦章一