FASTA形式

FASTA形式(FASTA format)

  • 塩基配列やアミノ酸配列を記述するためのデータ形式のひとつ.
  • 汎用性が高く,さまざまなプログラムで入力ファイルのフォーマットとして利用できる.
  • もともと配列の類似性を検索するためのプログラムFASTAで用いられていたフォーマットであることからこのように呼ばれる.
  • 内部はテキストファイルである.ファイルの拡張子は.fa,.fas,.fasta,.mfaなどが用いられる.
  • フラットファイル形式に含まれる付加情報(アノテーション)は記述できない.
  • 本来,FASTA形式は1つの配列を記述するものであり,複数の配列を記述するものはmulti-FASTA形式と呼ばれることがある.現在では,multi-FASTA形式も含めてFASTA形式と呼ばれるのが一般的である.

形式

>アクセッション番号など(ヘッダ行)
配列文字列

具体例