RepeatMaskerのエラー2件

deerのゲノムをRepeatMaskerでマスクしようとしていたら、2件のエラーが起こった。備忘として以下に記述する。

 


やろうとしていたこと

deer.fastaの情報を、RepeatMaskerの生物種ruminantiaでマスクしようとした。

 


問題1

以下のようにRepeatMaskerを実行したところ、terminationされた。

$ /home/usr/RepeatMasker/RepeatMasker -species Ruminantia deer.fasta
RepeatMasker version open-4.0.3
Search Engine: NCBI/RMBLAST [ 2.2.27+ ]
Master RepeatMasker Database: /home/usr/RepeatMasker/Libraries/RepeatMaskerLib.embl ( Complete Database: 20140131 )


Building species libraries in: /home/usr/RepeatMasker/Libraries/20140131/ruminantia
- 979 ancestral and ubiquitous sequence(s) for ruminantia
- 123 lineage specific sequence(s) for ruminantia

analyzing file deer.fasta
強制終了

 

 RepeatMaskerの結果フォルダ(RM_*******) とその中にdeer.fastaのコピーが生成された所で止まっていた。systemコールが発生していると判断し、system logを確認。

 

# tail -n 500 messages|grep "RepeatMasker"
Jun 17 12:23:47 localhost kernel: RepeatMasker invoked oom-killer: gfp_mask=0x200da, order=0, oom_adj=0, oom_score_adj=0
Jun 17 12:23:47 localhost kernel: RepeatMasker cpuset=/ mems_allowed=0
Jun 17 12:23:47 localhost kernel: Pid: 3959, comm: RepeatMasker Not tainted 2.6.32-504.8.1.el6.x86_64 #1
Jun 17 12:23:47 localhost kernel: [ 3959] 500 3959 1373067 872180 0 0 0 RepeatMasker
Jun 17 12:23:47 localhost kernel: Out of memory: Kill process 3959 (RepeatMasker) score 900 or sacrifice child
Jun 17 12:23:47 localhost kernel: Killed process 3959, UID 500, (RepeatMasker) total-vm:5492268kB, anon-rss:3488248kB, file-rss:472kB

 

メモリ超過のために、oom-killerが実行された模様。

参考: oom-killerについて | For Want Of A Better Word

 

 VM上の出来事だったので、割り振ったメモリを4GBから8GBに変更したところ収まった。

 


問題2

 

同様に以下の様にRepeatMaskerを実行したところ、 Can't forkと出力され止まってしまった。

 

$ /home/usr/RepeatMasker/RepeatMasker -species Ruminantia deer.fasta
RepeatMasker version open-4.0.3
Search Engine: NCBI/RMBLAST [ 2.2.27+ ]
Master RepeatMasker Database: /home/usr/RepeatMasker/Libraries/RepeatMaskerLib.embl ( Complete Database: 20140131 )

 

analyzing file deer.fasta

Checking for E. coli insertion elements
identifying Simple Repeats in batch 1 of 42096
identifying young abundant SINEs in batch 1 of 42096
identifying full-length interspersed repeats in batch 1 of 42096
identifying most interspersed repeats in batch 1 of 42096
identifying long interspersed repeats in batch 1 of 42096
identifying ancient repeats in batch 1 of 42096
identifying retrovirus-like sequences in batch 1 of 42096
identifying tough LINE1s in batch 1 of 42096
identifying Simple Repeats in batch 1 of 42096
Can't fork...

 

出力フォルダには以下のようなテンポラリファイルが生成されて溜まっている。

$ ls -l
合計 3191239
-rwxrwxrwx. 1 root root 3267767038 6月 17 13:45 2015 deer.fasta
-rwxrwxrwx. 1 root root 61045 6月 17 13:45 2015 deer.fasta_batch-1.masked
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.alu1
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.cut1
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.cut2
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.l1
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.mir
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.mirs
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.reps
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.retro
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.simple1
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.simple2
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 deer.fasta_batch-1.tmp.sines
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 trfResults-1434516337-2947.out
-rwxrwxrwx. 1 root root 0 6月 17 13:45 2015 trfResults-1434516338-2947.out

 

反復配列を確認する生物種をruminantiaからdeerに変えてみたところ、今度はFatal errorが発生した。

 

$ /home/usr/RepeatMasker/RepeatMasker -species deer deer.fasta
RepeatMasker version open-4.0.3
Search Engine: NCBI/RMBLAST [ 2.2.27+ ]
Master RepeatMasker Database: /home/usr/RepeatMasker/Libraries/RepeatMaskerLib.embl ( Complete Database: 20140131 )


Building species libraries in: /home/usr/RepeatMasker/Libraries/20140131/cervidae
- 995 ancestral and ubiquitous sequence(s) for cervidae
- 4 lineage specific sequence(s) for cervidae
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません

analyzing file deer.fasta

Checking for E. coli insertion elements
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
WARNING: The search engine returned an error (2, status = 2 )
Engine parameters: /usr/bin/rmblastn -db /home/usr/RepeatMasker/Libraries/20140131/general/is.lib -query deer.fasta_nt_batch-1.masked -gapopen 12 -gapextend 2 -complexity_adjust -word_size 15 -xdrop_ungap 34 -xdrop_gap_final 17 -xdrop_gap 8 -min_raw_gapped_score 17 -dust no -num_threads 4 -matrix identity.matrix
A search phase could not complete on this batch.
The batch file will be re-run and if possible the
program will resume.
WARNING: Retrying batch ( 1 ) [ 255,, 61045]...

Checking for E. coli insertion elements
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
WARNING: The search engine returned an error (2, status = 2 )
Engine parameters: /usr/bin/rmblastn -db /home/usr/RepeatMasker/Libraries/20140131/general/is.lib -query deer.fasta_nt_batch-1.masked -gapopen 12 -gapextend 2 -complexity_adjust -word_size 15 -xdrop_ungap 34 -xdrop_gap_final 17 -xdrop_gap 8 -min_raw_gapped_score 17 -dust no -num_threads 4 -matrix identity.matrix
A search phase could not complete on this batch.
The batch file will be re-run and if possible the
program will resume.
WARNING: Retrying batch ( 1 ) [ 255,, 61045]...

Checking for E. coli insertion elements
shell-init: error retrieving current directory: getcwd: cannot access parent directories: そのようなファイルやディレクトリはありません
WARNING: The search engine returned an error (2, status = 2 )
Engine parameters: /usr/bin/rmblastn -db /home/usr/RepeatMasker/Libraries/20140131/general/is.lib -query deer.fasta_nt_batch-1.masked -gapopen 12 -gapextend 2 -complexity_adjust -word_size 15 -xdrop_ungap 34 -xdrop_gap_final 17 -xdrop_gap 8 -min_raw_gapped_score 17 -dust no -num_threads 4 -matrix identity.matrix
A search phase could not complete on this batch.
The batch file will be re-run and if possible the
program will resume.


FATAL ERROR: RepeatMasker giving up. One or more
batches failed! Unfortunately this type of error
cannot be recovered from. Please submit the following
details to the feedback page at the repeatmasker
website:

http://www.repeatmasker.org

RepeatMasker Version: open-4.0.3
Library Version: 20140131
Search Engine: ncbi [ 2.2.27+ ]
Command Line: /home/usr/RepeatMasker/RepeatMasker-species deer deer.fasta
Batch Number: 1
Disk Space:
Filesystem 1K-blocks Used Available Use% Mounted on
.host:/ 233452540 183128292 50324248 79% /mnt/hgfs

Further details about this problem may be found in
the directory: /mnt/hgfs/index/deer//RM_6387.WedJun171403332015

 

この後、仮想OSを再起動したら何事もなく実行成功した。

何かのプロセスがゾンビ化してたか、データベースがきちんとクローズされていなかったのかも。

 

以上。