FASTA形式
FASTA形式(FASTA format)
- 塩基配列やアミノ酸配列を記述するためのデータ形式のひとつ.
- 汎用性が高く,さまざまなプログラムで入力ファイルのフォーマットとして利用できる.
- もともと配列の類似性を検索するためのプログラムFASTAで用いられていたフォーマットであることからこのように呼ばれる.
- 内部はテキストファイルである.ファイルの拡張子は.fa,.fas,.fasta,.mfaなどが用いられる.
- フラットファイル形式に含まれる付加情報(アノテーション)は記述できない.
- 本来,FASTA形式は1つの配列を記述するものであり,複数の配列を記述するものはmulti-FASTA形式と呼ばれることがある.現在では,multi-FASTA形式も含めてFASTA形式と呼ばれるのが一般的である.
形式
>アクセッション番号など(ヘッダ行) 配列文字列