世界中の研究機関や研究者が同定した塩基配列はデータベースに登録することになっている。 塩基配列データベースは日本、アメリカ、ヨーロッパの共同で運営されている。 日本は国立遺伝学研究所がデータベースDDBJ(DNA Data Bank of Japan)を提供している。 アメリカはNCBI (National Center for Biotechnology Information)がデータベースGenBankを提供している。 ヨーロッパはEBI (European Bioinformatics Institute)がデータベースEMBL-Bank/ENAを提供している。
DDBJは塩基配列に関する様々なサービスをウェブを通じて提供している。 まずそのホームページを開いてみる。ここをクリックするか、DDBJをキーワードに検索してみる。
DDBJのトップページの「検索」をクリックする。 続いて、「ARSA 高速な検索」をクリックしてキーワード検索のページを開く。 Quick Searchのテキストボックスに「tonsoku」を入力して「Search」をクリックする。
検索結果の上から2番目ぐらいにある「AB112744」をクリックすると、新しいページが開いて、遺伝子の情報が表示される。
LOCUS AB112744 4143 bp mRNA linear PLN 16-NOV-2004 DEFINITION Arabidopsis thaliana tsk mRNA for TONSOKU protein, complete cds. ACCESSION AB112744 VERSION AB112744.1 KEYWORDS . SOURCE Arabidopsis thaliana (thale cress) ORGANISM Arabidopsis thaliana Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; Gunneridae; Pentapetalae; rosids; malvids; Brassicales; Brassicaceae; Camelineae; Arabidopsis. REFERENCE 1 (bases 1 to 4143) AUTHORS Suzuki,T., Nakamura,K. and Morikami,A. TITLE Direct Submission JOURNAL Submitted (19-JUN-2003) to the DDBJ/EMBL/GenBank databases. Contact:Takamasa Suzuki Graduate School of Bioagricultural Sciences, Nagoya University, Laboratory of Biochemistry; Furo-cho, Nagoya, Aichi 464-8601, Japan REFERENCE 2 AUTHORS Suzuki,T., Inagaki,S., Nakajima,S., Akashi,T., Ohto,M., Kobayashi,M., Seki,M., Shinozaki,K., Kato,T., Tabata,S., Nakamura,K. and Morikami,A. TITLE A novel Arabidopsis gene TONSOKU is required for proper cell arrangement in root and shoot apical meristems JOURNAL Plant J. 38, 673-684 (2004) COMMENT FEATURES Location/Qualifiers source 1..4143 /chromosome="3" /db_xref="taxon:3702" /mol_type="mRNA" /organism="Arabidopsis thaliana" CDS 115..4050 /codon_start=1 /gene="tsk" /product="TONSOKU protein" /protein_id="BAD04041.1" /transl_table=1 /translation="MGRLDVAAAKRAYRKAEEVGDRREQARWANNVGDILKNHGEYVD ALKWFRIDYDISVKYLPGKDLLPTCQSLGEIYLRLENFEEALIYQKKHLQLAEEANDT VEKQRACTQLGRTYHEMFLKSEDDCEAIQSAKKYFKKAMELAQILKEKPPPGESSGFL EEYINAHNNIGMLDLDLDNPEAARTILKKGLQICDEEEVREYDAARSRLHHNLGNVFM ALRSWDEAKKHIEMDINICHKINHVQGEAKGYINLAELHNKTQKYIDALLCYGKASSL AKSMQDESALVEQIEHNTKIVKKSMKVMEELREEELMLKKLSAEMTDAKGTSEERKSM LQVNACLGSLIDKSSMVFAWLKHLQYSKRKKKISDELCDKEKLSDAFMIVGESYQNLR NFRKSLKWFIRSYEGHEAIGNLEGQALAKINIGNGLDCIGEWTGALQAYEEGYRIALK ANLPSIQLSALEDIHYIHMMRFGNAQKASELKETIQNLKESEHAEKAECSTQDECSET DSEGHANVSNDRPNACSSPQTPNSLRSERLADLDEANDDVPLISFLQPGKRLFKRKQV SGKQDADTDQTKKDFSVVADSQQTVAGRKRIRVILSDDESETEYELGCPKDSSHKVLR QNEEVSEESMYFDGAINYTDNRAIQDNVEEGSCSYTPLHPIKVAPNVSNCRSLSNNIA VETTGRRKKGSQCDVGDSNGTSCKTGAALVNFHAYSKTEDRKIKIEIENEHIALDSCS HDDESVKVELTCLYYLQLPDDEKSKGLLPIIHHLEYGGRVLKPLELYAILRDSSENVV IEASVDGWVHKRLMKLYMDCCQSLSEKPSMKLLKKLYISEVEDDINVSECELQDISAA PLLCALHVHNIAMLDLSHNMLGNGTMEKLKQLFASSSQMYGALTLDLHCNRFGPTALF QICECPVLFTRLEVLNVSRNRLTDACGSYLSTIVKNCRALYSLNVEHCSLTSRTIQKV ANALDSKSGLSQLCIGYNNPVSGSSIQNLLAKLATLSSFAELSMNGIKLSSQVVDSLY ALVKTPSLSKLLVGSSGIGTDGAIKVTESLCYQKEETVKLDLSCCGLASSFFIKLNQD VTLTSSILEFNVGGNPITEEGISALGELLRNPCSNIKVLILSKCHLKLAGLLCIIQAL SDNKNLEELNLSDNAKIEDETVFGQPVKERSVMVEQEHGTCKSVTSMDKEQELCETNM ECDDLEVADSEDEQIEEGTATSSSLSLPRKNHIVKELSTALSMANQLKILDLSNNGFS VEALETLYMSWSSSSSRTGIAQRHVKEETVHFYVEGKMCCGVKSCCRKD" BASE COUNT 1339 a 736 c 949 g 1119 t ORIGIN 1 gactggagaa aatgagaaaa tcaaaatcac tgagaaagaa atttcgagaa atctgaaaat 61 cggaaggaag aaaacaaaaa cctttcaatt gaagaacgga gaaatcatca tccgatgggt 121 cgattagatg tagctgcggc gaagagagcg taccggaaag cagaagaagt gggtgaccgg 181 agagaacagg cgaggtgggc taacaatgtc ggcgatatcc ttaagaatca tggagagtac 241 gttgatgctc tcaagtggtt taggattgat tacgatatct ccgtcaagta tttacctggg 301 aaagatttgt tacctacttg tcagtctctt ggcgagatct atctccgcct cgaaaatttc 361 gaagaagcct tgatttatca gaagaagcat ttacagctag ctgaagaagc taatgacact 421 gtggagaagc aaagagcatg tactcaactt ggacgtactt accatgaaat gttcttgaag 481 tctgaggatg attgtgaagc cattcagagt gctaaaaagt actttaagaa agccatggaa 541 cttgcacaga ttctcaagga gaaaccacct cctggagaat ctagcggatt ccttgaggag 601 tatattaacg cacataacaa catcggtatg cttgaccttg atcttgataa tcctgaagca 661 gcccgtacta ttcttaagaa agggctgcag atttgcgatg aagaggaggt gagagagtat 721 gatgctgctc ggagtaggct tcatcataac cttggaaacg tttttatggc gctgagaagt 781 tgggatgaag caaagaaaca cattgagatg gatattaata tctgtcataa gattaatcat 841 gtccaaggag aagcgaaggg gtatatcaat ctcgctgaat tacacaacaa gacccaaaag 901 tacattgatg ctcttttatg ttatggtaaa gcttctagtc tagcgaaatc tatgcaagac 961 gagagtgcat tggttgaaca gatagagcat aataccaaga tagtcaagaa atccatgaaa 1021 gttatggaag aattgagaga agaagagctt atgcttaaga agttgtctgc agaaatgact 1081 gatgccaaag gcacttcgga ggaacgaaag tctatgctcc aagtaaatgc ttgtcttgga 1141 agtcttattg ataaatctag catggtattc gcatggctga agcatcttca atattcaaaa 1201 aggaagaaga aaatatcaga tgaactctgt gacaaggaaa agctgagtga tgccttcatg 1261 attgttggag aatcttacca aaatctcaga aatttcagaa agtccctgaa gtggttcata 1321 agaagttatg agggacatga agcaattggt aatctggagg gtcaagcact agcgaagatt 1381 aatattggta atggtttgga ctgtattggg gaatggacag gagcacttca ggcatatgaa 1441 gaggggtaca gaattgcttt gaaagctaat cttccttcaa tccagctttc tgcactggaa 1501 gatatacact atatccatat gatgagattt gggaatgctc aaaaagccag tgaattgaag 1561 gaaacaatac aaaatctgaa ggagtcagaa catgctgaga aagccgaatg tagtacacaa 1621 gatgaatgct ctgaaactga ctcagaaggg catgcgaatg tatcgaatga taggccaaat 1681 gcatgtagct caccgcaaac accaaattca cttagatcag aacggttagc agatctggat 1741 gaagcaaatg atgatgtgcc actaatttca tttctccagc ctggaaaacg tctgttcaaa 1801 aggaaacaag tttcaggaaa acaagatgct gacactgatc agacgaagaa agatttctct 1861 gtagtagcag actctcagca gacagttgct ggtcgaaagc gtattcgagt aatcctctct 1921 gatgatgaaa gtgagaccga atatgagctg ggatgcccta aagacagttc tcacaaagtt 1981 ctaaggcaga atgaagaggt ttctgaggaa agtatgtatt ttgatggtgc tattaattat 2041 acggataatc gtgccatcca agataatgta gaagaaggtt cttgctcgta tacgcctctc 2101 catcctatta aggtggctcc aaatgtcagc aattgtagat ctttgagtaa taatatagct 2161 gttgaaacaa ctggtcgtcg taaaaaagga tctcaatgtg atgttggcga ctccaacggc 2221 acgtcctgca aaactggagc tgctctcgtg aacttccacg cttactcaaa aactgaggat 2281 cgaaaaataa aaattgaaat tgaaaatgaa cacatagctt tagactcctg ttctcacgat 2341 gatgagtctg tgaaggtgga acttacttgc ctatactatt tacagcttcc tgacgatgag 2401 aaatctaaag gtctgttgcc gatcattcat catttggaat atggtggaag agttctgaaa 2461 ccattggaac tatatgcgat tctcagggac tcttctgaaa atgttgttat tgaagcttcc 2521 gttgatggct gggttcacaa gcgcctgatg aaactataca tggactgttg ccagtcgttg 2581 tcagagaaac ccagtatgaa attgcttaag aaattatata tttcggaggt agaagatgat 2641 atcaatgtgt cagaatgtga actgcaagac atatcagctg ctccattatt gtgtgccctc 2701 catgtccaca atattgctat gttggatctc tcccacaata tgctagggaa tggaacaatg 2761 gagaaattga aacaactttt tgcctcatca agccagatgt atggtgcttt aactttggat 2821 ttgcactgca atcgatttgg tccaactgct ttgtttcaga tctgtgaatg ccctgttctg 2881 ttcactcgac ttgaagtcct caatgtgtcc aggaatcgac ttacagatgc ttgtggatca 2941 tacctctcaa ctatagtgaa aaattgccgg gcactttaca gcttgaatgt ggaacattgt 3001 tcacttacat caagaacaat ccaaaaggta gctaatgctt tggattcgaa gtcaggactt 3061 tcacaactct gtataggtta taataatcct gtttcaggga gtagtattca aaacctcttg 3121 gctaaattgg ctactctaag cagctttgca gaactgagca tgaatggcat aaagctgagc 3181 agccaagttg ttgatagcct ttatgcactt gttaagactc catctctgtc aaaacttttg 3241 gttggcagca gtggaatagg aacggacggg gctataaaag ttactgaatc tctatgttat 3301 cagaaggaag aaactgtgaa gctcgacctt tcatgttgtg gactagcttc ctctttcttt 3361 attaagctca accaagatgt tactctaacc tctagcattc ttgagtttaa tgttggagga 3421 aatccaatca ccgaagaggg aatcagtgca cttggggagc tgcttaggaa tccttgttca 3481 aacataaaag ttcttattct aagcaagtgt catctgaagc tcgctgggct tctatgcata 3541 attcaagcac tttcagataa taagaatctt gaagagctta atctttctga caatgctaag 3601 atagaagatg agactgtgtt tggccaacct gtgaaggaaa gatcagtaat ggtagagcaa 3661 gaacatggaa catgtaaatc tgtcacctca atggacaaag aacaagagct atgtgaaacc 3721 aatatggagt gtgatgatct cgaagttgca gacagcgaag atgaacaaat agaggaagga 3781 actgcaacct cgagtagtct tagtttgcca cgcaagaacc atatcgtgaa agagctttct 3841 accgctcttt caatggctaa ccagttgaag attctggact taagcaacaa tgggttctca 3901 gttgaagcct tggaaacatt atacatgtca tggtcatcat caagctcccg aactggcatc 3961 gcccaaaggc atgtaaaaga agagactgtc catttttatg tcgaaggaaa gatgtgttgc 4021 ggagtcaaat catgctgcag aaaggactga agaagatctt gtctgaaact gtatttgcca 4081 ataataaacc tctgttttta aatattgagt atttttattt agagcgtttg cagaaatttt 4141 tac //
2016年のノーベル医学・生理学賞は大隅良典先生に送られることが決まった。 受賞の理由は酵母を用いてオートファジーという現象を見つけたとある。
Ohsumiとyeastをキーワードにどのような遺伝子がオートファジーに関わるのかを調べてみよ。
ABO式血液型は血液型の分類法の一種で、A、B、O、ABの4型に分類する(ウィキペディアより)。 赤血球の表面にたくさんある抗原の種類の一つで、A型とB型はその代表的な抗原である。 A型抗原を持つとA型、B型抗原を持つとB型、両方を持つとAB型、両方持たないとO型とする。 血漿の中には自分が持たない抗原に対して抗体を持ち、O型の血漿にはA型とB型に対する抗体が存在する。 参考文献 (PDFファイル)
A型およびB型の抗原は赤血球表面の糖鎖が異なり、O型はその糖鎖を付加することができない。 A型およびB型を決める遺伝子の実態を調べてみる。
Googleで「血液型 遺伝子」をキーワードに検索を実行すると、ABO式血液型という単語が見えてくる。 次に、「ABO式血液型 遺伝子」をキーワードに検索を実行すると、ABO式血液型糖転移酵素という単語が見えてくる。 糖転移酵素はglycosyltransferaseの日本語訳であるので、これを遺伝子検索のキーワードにする。
ABO glycosyltransferaseを検索し、FacetでHomo sapiensをクリックすると、484個の候補がでてくる。
partial(部分)という単語が目につくので、逆にcomplete(完全)という単語をキーワードに追加してみる。
FacetでHomo sapiensに限定すると、17個の遺伝子が残る。 JN851703にglycosyltransferase A (ABO) geneとあり、HQ317214にglycosyltransferase B (ABO) geneとあるので、これらがA型とB型の遺伝子であることが予想される。
メンデルが遺伝の研究にエンドウを用いたことはよく知られている。 メンデルが研究対象とした表現型は7つあるが、そのうちの一つは種の形であった。 メンデルは種子の形のうちしわと丸が対立形質であることを見出した。
メンデルが見出した丸としわをもたらす遺伝子の実体は現在までに明らかになっている。 すなわち、しわができる形質はデンプン分枝酵素I(Starch Branching Enzyme 1)の欠損によるものであることが明らかとなっている。 デンプン分枝酵素Iの欠損により種子に多量の低分子糖が蓄積し、その結果浸透圧があがり、水分量が増える。 増えた水が種子の乾燥時になくなるとしわができると考えられている。
参考文献 (PDFファイル) ハートウェル遺伝学第2章より抜粋
デンプン分枝酵素はstarch branching enzymeである。 エンドウの学名をGoogleで検索する。 両方のキーワードを合わせてDDBJで検索をすると下記のような結果が得られる。
SbeIIがたくさん表示されるのでキーワードの"starch branching enzyme"をSbeIに変更して再度検索を行う。 検索結果は下記のようになる。
見つかったX800009を開くと塩基配列などを知ることができる。 塩基配列が報告されたのはいつか、全体で何塩基あるか、四塩基のそれぞれの数などを見てみよ。