バイオインフォマティクス 中部大学2024年秋学期

データベースを検索する

遺伝子の塩基配列を調べる

遺伝子データベースとは

世界中の研究機関や研究者が同定した塩基配列はデータベースに登録することになっている。 塩基配列データベースは日本、アメリカ、ヨーロッパの共同で運営されている。 日本は国立遺伝学研究所がデータベースDDBJ(DNA Data Bank of Japan)を提供している。 アメリカはNCBI (National Center for Biotechnology Information)がデータベースGenBankを提供している。 ヨーロッパはEBI (European Bioinformatics Institute)がデータベースEMBL-Bank/ENAを提供している。

DDBJを利用する

DDBJは塩基配列に関する様々なサービスをウェブを通じて提供している。 まずそのホームページを開いてみる。ここをクリックするか、DDBJをキーワードに検索してみる。

キーワードで検索する

DDBJのトップページの「検索」をクリックする。 続いて、「ARSA 高速な検索」をクリックしてキーワード検索のページを開く。 Quick Searchのテキストボックスに「tonsoku」を入力して「Search」をクリックする。

遺伝子の情報を見る

検索結果の上から2番目ぐらいにある「AB112744」をクリックすると、新しいページが開いて、遺伝子の情報が表示される。

LOCUS  AB112744  4143 bp mRNA linear PLN 16-NOV-2004
DEFINITION Arabidopsis thaliana tsk mRNA for TONSOKU protein, complete cds.
ACCESSION AB112744
VERSION  AB112744.1
KEYWORDS .
SOURCE  Arabidopsis thaliana (thale cress)
 ORGANISM Arabidopsis thaliana
 Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta;
 Spermatophyta; Magnoliophyta; eudicotyledons; Gunneridae;
 Pentapetalae; rosids; malvids; Brassicales; Brassicaceae;
 Camelineae; Arabidopsis.
REFERENCE 1 (bases 1 to 4143)
 AUTHORS Suzuki,T., Nakamura,K. and Morikami,A.
 TITLE  Direct Submission
 JOURNAL Submitted (19-JUN-2003) to the DDBJ/EMBL/GenBank databases.
 Contact:Takamasa Suzuki
 Graduate School of Bioagricultural Sciences, Nagoya University,
 Laboratory of Biochemistry; Furo-cho, Nagoya, Aichi 464-8601, Japan
REFERENCE 2
 AUTHORS Suzuki,T., Inagaki,S., Nakajima,S., Akashi,T., Ohto,M.,
 Kobayashi,M., Seki,M., Shinozaki,K., Kato,T., Tabata,S.,
 Nakamura,K. and Morikami,A.
 TITLE  A novel Arabidopsis gene TONSOKU is required for proper cell
 arrangement in root and shoot apical meristems
 JOURNAL Plant J. 38, 673-684 (2004)
COMMENT  
FEATURES  Location/Qualifiers
  source 1..4143
    /chromosome="3"
    /db_xref="taxon:3702"
    /mol_type="mRNA"
    /organism="Arabidopsis thaliana"
  CDS  115..4050
    /codon_start=1
    /gene="tsk"
    /product="TONSOKU protein"
    /protein_id="BAD04041.1"
    /transl_table=1
    /translation="MGRLDVAAAKRAYRKAEEVGDRREQARWANNVGDILKNHGEYVD
    ALKWFRIDYDISVKYLPGKDLLPTCQSLGEIYLRLENFEEALIYQKKHLQLAEEANDT
    VEKQRACTQLGRTYHEMFLKSEDDCEAIQSAKKYFKKAMELAQILKEKPPPGESSGFL
    EEYINAHNNIGMLDLDLDNPEAARTILKKGLQICDEEEVREYDAARSRLHHNLGNVFM
    ALRSWDEAKKHIEMDINICHKINHVQGEAKGYINLAELHNKTQKYIDALLCYGKASSL
    AKSMQDESALVEQIEHNTKIVKKSMKVMEELREEELMLKKLSAEMTDAKGTSEERKSM
    LQVNACLGSLIDKSSMVFAWLKHLQYSKRKKKISDELCDKEKLSDAFMIVGESYQNLR
    NFRKSLKWFIRSYEGHEAIGNLEGQALAKINIGNGLDCIGEWTGALQAYEEGYRIALK
    ANLPSIQLSALEDIHYIHMMRFGNAQKASELKETIQNLKESEHAEKAECSTQDECSET
    DSEGHANVSNDRPNACSSPQTPNSLRSERLADLDEANDDVPLISFLQPGKRLFKRKQV
    SGKQDADTDQTKKDFSVVADSQQTVAGRKRIRVILSDDESETEYELGCPKDSSHKVLR
    QNEEVSEESMYFDGAINYTDNRAIQDNVEEGSCSYTPLHPIKVAPNVSNCRSLSNNIA
    VETTGRRKKGSQCDVGDSNGTSCKTGAALVNFHAYSKTEDRKIKIEIENEHIALDSCS
    HDDESVKVELTCLYYLQLPDDEKSKGLLPIIHHLEYGGRVLKPLELYAILRDSSENVV
    IEASVDGWVHKRLMKLYMDCCQSLSEKPSMKLLKKLYISEVEDDINVSECELQDISAA
    PLLCALHVHNIAMLDLSHNMLGNGTMEKLKQLFASSSQMYGALTLDLHCNRFGPTALF
    QICECPVLFTRLEVLNVSRNRLTDACGSYLSTIVKNCRALYSLNVEHCSLTSRTIQKV
    ANALDSKSGLSQLCIGYNNPVSGSSIQNLLAKLATLSSFAELSMNGIKLSSQVVDSLY
    ALVKTPSLSKLLVGSSGIGTDGAIKVTESLCYQKEETVKLDLSCCGLASSFFIKLNQD
    VTLTSSILEFNVGGNPITEEGISALGELLRNPCSNIKVLILSKCHLKLAGLLCIIQAL
    SDNKNLEELNLSDNAKIEDETVFGQPVKERSVMVEQEHGTCKSVTSMDKEQELCETNM
    ECDDLEVADSEDEQIEEGTATSSSLSLPRKNHIVKELSTALSMANQLKILDLSNNGFS
    VEALETLYMSWSSSSSRTGIAQRHVKEETVHFYVEGKMCCGVKSCCRKD"
BASE COUNT 1339 a   736 c   949 g   1119 t
ORIGIN  
  1 gactggagaa aatgagaaaa tcaaaatcac tgagaaagaa atttcgagaa atctgaaaat
  61 cggaaggaag aaaacaaaaa cctttcaatt gaagaacgga gaaatcatca tccgatgggt
  121 cgattagatg tagctgcggc gaagagagcg taccggaaag cagaagaagt gggtgaccgg
  181 agagaacagg cgaggtgggc taacaatgtc ggcgatatcc ttaagaatca tggagagtac
  241 gttgatgctc tcaagtggtt taggattgat tacgatatct ccgtcaagta tttacctggg
  301 aaagatttgt tacctacttg tcagtctctt ggcgagatct atctccgcct cgaaaatttc
  361 gaagaagcct tgatttatca gaagaagcat ttacagctag ctgaagaagc taatgacact
  421 gtggagaagc aaagagcatg tactcaactt ggacgtactt accatgaaat gttcttgaag
  481 tctgaggatg attgtgaagc cattcagagt gctaaaaagt actttaagaa agccatggaa
  541 cttgcacaga ttctcaagga gaaaccacct cctggagaat ctagcggatt ccttgaggag
  601 tatattaacg cacataacaa catcggtatg cttgaccttg atcttgataa tcctgaagca
  661 gcccgtacta ttcttaagaa agggctgcag atttgcgatg aagaggaggt gagagagtat
  721 gatgctgctc ggagtaggct tcatcataac cttggaaacg tttttatggc gctgagaagt
  781 tgggatgaag caaagaaaca cattgagatg gatattaata tctgtcataa gattaatcat
  841 gtccaaggag aagcgaaggg gtatatcaat ctcgctgaat tacacaacaa gacccaaaag
  901 tacattgatg ctcttttatg ttatggtaaa gcttctagtc tagcgaaatc tatgcaagac
  961 gagagtgcat tggttgaaca gatagagcat aataccaaga tagtcaagaa atccatgaaa
  1021 gttatggaag aattgagaga agaagagctt atgcttaaga agttgtctgc agaaatgact
  1081 gatgccaaag gcacttcgga ggaacgaaag tctatgctcc aagtaaatgc ttgtcttgga
  1141 agtcttattg ataaatctag catggtattc gcatggctga agcatcttca atattcaaaa
  1201 aggaagaaga aaatatcaga tgaactctgt gacaaggaaa agctgagtga tgccttcatg
  1261 attgttggag aatcttacca aaatctcaga aatttcagaa agtccctgaa gtggttcata
  1321 agaagttatg agggacatga agcaattggt aatctggagg gtcaagcact agcgaagatt
  1381 aatattggta atggtttgga ctgtattggg gaatggacag gagcacttca ggcatatgaa
  1441 gaggggtaca gaattgcttt gaaagctaat cttccttcaa tccagctttc tgcactggaa
  1501 gatatacact atatccatat gatgagattt gggaatgctc aaaaagccag tgaattgaag
  1561 gaaacaatac aaaatctgaa ggagtcagaa catgctgaga aagccgaatg tagtacacaa
  1621 gatgaatgct ctgaaactga ctcagaaggg catgcgaatg tatcgaatga taggccaaat
  1681 gcatgtagct caccgcaaac accaaattca cttagatcag aacggttagc agatctggat
  1741 gaagcaaatg atgatgtgcc actaatttca tttctccagc ctggaaaacg tctgttcaaa
  1801 aggaaacaag tttcaggaaa acaagatgct gacactgatc agacgaagaa agatttctct
  1861 gtagtagcag actctcagca gacagttgct ggtcgaaagc gtattcgagt aatcctctct
  1921 gatgatgaaa gtgagaccga atatgagctg ggatgcccta aagacagttc tcacaaagtt
  1981 ctaaggcaga atgaagaggt ttctgaggaa agtatgtatt ttgatggtgc tattaattat
  2041 acggataatc gtgccatcca agataatgta gaagaaggtt cttgctcgta tacgcctctc
  2101 catcctatta aggtggctcc aaatgtcagc aattgtagat ctttgagtaa taatatagct
  2161 gttgaaacaa ctggtcgtcg taaaaaagga tctcaatgtg atgttggcga ctccaacggc
  2221 acgtcctgca aaactggagc tgctctcgtg aacttccacg cttactcaaa aactgaggat
  2281 cgaaaaataa aaattgaaat tgaaaatgaa cacatagctt tagactcctg ttctcacgat
  2341 gatgagtctg tgaaggtgga acttacttgc ctatactatt tacagcttcc tgacgatgag
  2401 aaatctaaag gtctgttgcc gatcattcat catttggaat atggtggaag agttctgaaa
  2461 ccattggaac tatatgcgat tctcagggac tcttctgaaa atgttgttat tgaagcttcc
  2521 gttgatggct gggttcacaa gcgcctgatg aaactataca tggactgttg ccagtcgttg
  2581 tcagagaaac ccagtatgaa attgcttaag aaattatata tttcggaggt agaagatgat
  2641 atcaatgtgt cagaatgtga actgcaagac atatcagctg ctccattatt gtgtgccctc
  2701 catgtccaca atattgctat gttggatctc tcccacaata tgctagggaa tggaacaatg
  2761 gagaaattga aacaactttt tgcctcatca agccagatgt atggtgcttt aactttggat
  2821 ttgcactgca atcgatttgg tccaactgct ttgtttcaga tctgtgaatg ccctgttctg
  2881 ttcactcgac ttgaagtcct caatgtgtcc aggaatcgac ttacagatgc ttgtggatca
  2941 tacctctcaa ctatagtgaa aaattgccgg gcactttaca gcttgaatgt ggaacattgt
  3001 tcacttacat caagaacaat ccaaaaggta gctaatgctt tggattcgaa gtcaggactt
  3061 tcacaactct gtataggtta taataatcct gtttcaggga gtagtattca aaacctcttg
  3121 gctaaattgg ctactctaag cagctttgca gaactgagca tgaatggcat aaagctgagc
  3181 agccaagttg ttgatagcct ttatgcactt gttaagactc catctctgtc aaaacttttg
  3241 gttggcagca gtggaatagg aacggacggg gctataaaag ttactgaatc tctatgttat
  3301 cagaaggaag aaactgtgaa gctcgacctt tcatgttgtg gactagcttc ctctttcttt
  3361 attaagctca accaagatgt tactctaacc tctagcattc ttgagtttaa tgttggagga
  3421 aatccaatca ccgaagaggg aatcagtgca cttggggagc tgcttaggaa tccttgttca
  3481 aacataaaag ttcttattct aagcaagtgt catctgaagc tcgctgggct tctatgcata
  3541 attcaagcac tttcagataa taagaatctt gaagagctta atctttctga caatgctaag
  3601 atagaagatg agactgtgtt tggccaacct gtgaaggaaa gatcagtaat ggtagagcaa
  3661 gaacatggaa catgtaaatc tgtcacctca atggacaaag aacaagagct atgtgaaacc
  3721 aatatggagt gtgatgatct cgaagttgca gacagcgaag atgaacaaat agaggaagga
  3781 actgcaacct cgagtagtct tagtttgcca cgcaagaacc atatcgtgaa agagctttct
  3841 accgctcttt caatggctaa ccagttgaag attctggact taagcaacaa tgggttctca
  3901 gttgaagcct tggaaacatt atacatgtca tggtcatcat caagctcccg aactggcatc
  3961 gcccaaaggc atgtaaaaga agagactgtc catttttatg tcgaaggaaa gatgtgttgc
  4021 ggagtcaaat catgctgcag aaaggactga agaagatctt gtctgaaact gtatttgcca
  4081 ataataaacc tctgttttta aatattgagt atttttattt agagcgtttg cagaaatttt
  4141 tac
//

見方

ACCESSION
全てのデータベースで共通の遺伝子番号
SOURCE ORGANISM
その塩基配列を持つ生物
REFERENCE
その塩基配列を登録した研究者や関連した文献の情報
CDS
タンパク質をコードしている領域。Coding Sequence
ORIGIN
塩基配列

アクセッション番号 AB004568 を調べてみよ

オートファジーに関わる遺伝子

2016年のノーベル医学・生理学賞は大隅良典先生に送られることが決まった。 受賞の理由は酵母を用いてオートファジーという現象を見つけたとある。

Ohsumiとyeastをキーワードにどのような遺伝子がオートファジーに関わるのかを調べてみよ。

ABO式血液型を決める遺伝子

ABO式血液型は血液型の分類法の一種で、A、B、O、ABの4型に分類する(ウィキペディアより)。 赤血球の表面にたくさんある抗原の種類の一つで、A型とB型はその代表的な抗原である。 A型抗原を持つとA型、B型抗原を持つとB型、両方を持つとAB型、両方持たないとO型とする。 血漿の中には自分が持たない抗原に対して抗体を持ち、O型の血漿にはA型とB型に対する抗体が存在する。 参考文献 (PDFファイル)

A型およびB型の抗原は赤血球表面の糖鎖が異なり、O型はその糖鎖を付加することができない。 A型およびB型を決める遺伝子の実態を調べてみる。

遺伝子検索のキーワードを探す

Googleで「血液型 遺伝子」をキーワードに検索を実行すると、ABO式血液型という単語が見えてくる。 次に、「ABO式血液型 遺伝子」をキーワードに検索を実行すると、ABO式血液型糖転移酵素という単語が見えてくる。 糖転移酵素はglycosyltransferaseの日本語訳であるので、これを遺伝子検索のキーワードにする。

DDBJで検索をする

ABO glycosyltransferaseを検索し、FacetでHomo sapiensをクリックすると、484個の候補がでてくる。

partial(部分)という単語が目につくので、逆にcomplete(完全)という単語をキーワードに追加してみる。

FacetでHomo sapiensに限定すると、17個の遺伝子が残る。 JN851703にglycosyltransferase A (ABO) geneとあり、HQ317214にglycosyltransferase B (ABO) geneとあるので、これらがA型とB型の遺伝子であることが予想される。

メンデルの遺伝子

メンデルが遺伝の研究にエンドウを用いたことはよく知られている。 メンデルが研究対象とした表現型は7つあるが、そのうちの一つは種の形であった。 メンデルは種子の形のうちしわと丸が対立形質であることを見出した。

メンデルが見出した丸としわをもたらす遺伝子の実体は現在までに明らかになっている。 すなわち、しわができる形質はデンプン分枝酵素I(Starch Branching Enzyme 1)の欠損によるものであることが明らかとなっている。 デンプン分枝酵素Iの欠損により種子に多量の低分子糖が蓄積し、その結果浸透圧があがり、水分量が増える。 増えた水が種子の乾燥時になくなるとしわができると考えられている。

参考文献 (PDFファイル) ハートウェル遺伝学第2章より抜粋

エンドウのデンプン分枝酵素Iの塩基配列を調べる

デンプン分枝酵素はstarch branching enzymeである。 エンドウの学名をGoogleで検索する。 両方のキーワードを合わせてDDBJで検索をすると下記のような結果が得られる。

SbeIIがたくさん表示されるのでキーワードの"starch branching enzyme"をSbeIに変更して再度検索を行う。 検索結果は下記のようになる。

見つかったX800009を開くと塩基配列などを知ることができる。 塩基配列が報告されたのはいつか、全体で何塩基あるか、四塩基のそれぞれの数などを見てみよ。