PDBデータ仕様変更に向けて対策開始

ecochem2007-06-10

2007/05/23に続けて自作コンテンツの楽屋裏話で,2007/07/01の本格的PDBデータフォーマット変更に向けて少し検討したので経過報告。別の締め切り仕事に追われつつの作業になっている。

にあるように,すでに変更フォーマット案も公開されているし,旧フォーマットも引き続きDLできるらしい。私にとって一番気になるのが,データサイズを小さくするための,

を変更しなければならないか否かというところなのだが,数データについて試したところ大丈夫のようで少しホッとしている。
個別PDBデータは,


PDBデータ246dについて現在PDBjでDLできるデータの種類

なお,上図にあるようにPDBデータは拡張子がentである上に(内容はpdbと同じ),gz形式で圧縮されているため,解凍ソフトを入手してまず解凍する必要がある。
次にJmolスクリプトでデータの表示形式を変更できるようにする上で,冒頭の修正プロジェクトに記載されている,“デオキシリボヌクレオチドは DA, DC, DG, DT, DIと表記し,リボヌクレオチドはこれまでどおりA, C, G, T, Iと表記”というところが最初の課題であるがこれも,単純なHTMLの書き換えでどうにか対応できそう。以下がその成果例だが,その他の規格変更ともあわせ新旧両フォーマットに対応できるようにしていく必要があるだろう。なかなか手間のかかる作業になるが,まずは方向性うが見えて一安心というところ。

新形式のPDBデータ例246d(DNA)について新旧Jmolスクリプトによる表示の比較
〔左〕Jmol標準の原子色,〔中〕旧HTMLでのDNAのATGC色分け表示(誤表示),〔右〕同修正HTML(正しく表示)
※トップ小画像も同データについて正しく表示された例