2009年11月20日金曜日

政治家と科学者の関係について

政治家と科学者の関係について。

 小泉政権下で、「聖域なき構造改革」が断行されました。これにより国立研究
所や国立大学の独法化が決まりました。科学研究に政治家がメスを入れたわけで
す。この時点で科学者たちは団結して抗議行動をするべきだったと思います。
「科学者は意外に我々政治家の介入を許し勢力削減の意向も唯唯諾諾」と思われ
たのでしょう。簡単に言うと、甘く見られ付け込まれてしまったのです。それ
が、今回の仕分け作業の結果を招いたと言えます。日本の未来を、運命を握るの
が科学技術であることは明白なのですから、科学者たちは聖域であると断じ指一本
触れさせず毅然とした対応をするべきであったと思います。
 
 「政治家は、国家を発展させることを目的とする」 これは自明だと思いま
す。国益増進に努める、それが政治家のあるべき姿だと思います(それが行き過
ぎると、国家間の過当競争、そして戦争ということになってしまうのですが、そ
こまでしての国益を日本国民は期待していません。首相が「これから、戦争しま
す」などといったら、たちまち内閣不信任案で解散決議でしょうから、少なくと
も現在の日本ではその心配はいりません)。日本という資源の無い国家の発展に
は、科学技術の推進が不可欠です。そこで、これまでの日本の政治家は科学者を
味方につけ、国力の増進に使ってきました。多かれ少なかれ摩擦はあったに違い
ないにせよ、両者の信頼関係によって成り立って来たと思います。今や、その信
頼関係は、政治家サイドから一方的に破棄され、多くの研究者たちは民主党には
不信感を頂いてしまっています。このような状況では、やがて国力が衰退するこ
とは目に見えています。

 研究者は国家の援助をあきらめ、民間の資金で研究を行うべきとの論調があり
ます。無論そのようなケースが存在して良いと思います。すでに企業と連携し成
功を収めた大学や研究所はたくさんあります。企業の場合、国家の発展よりも企
業の利益を重視します。利益の一部は税金として国庫に納められ、結果として国
家が潤いますから、国益に繋がります。これはこれで良いと思います。しかし、
それだけで良いのでしょうか。他国に伍することは無いのでしょうか。国力を維
持・増進するに必要なものは、お金だけではありません。お金では買えないもの
を作り出すのは、科学技術です。お金で買えない科学技術を、国が国家戦略とし
て欲したとき、政治家と科学者が連携する時なのだと思います。ここで重要なの
は、国民ではなく、あくまで国が必要とするものを作る、ということです。国民
が必要とするものは、企業が主体となって作ってどんどん売るべきです。国民が
必要ないと判断したからといって、国費による研究を中断するのは過剰反応で
す。国費による研究は、国家が必要としないと判断した時に、中止するべきもの
です。

 残念ながら、民主党は、国家戦略として欲する科学技術が無いのだろうと思い
ます。日本は科学技術によって発展した国家である事はさすがに知っていると思
いますので、実際は将来的な国家発展のビジョンすら持ち合わせていないのだと考えられます。
これは大きな問題です。選挙前、民主党の科学技術政策は
分かりにくく、少なくとも詳細な説明はありませんでした。きっと、その時か
ら、国家の発展に科学技術を使うという発想が無かったのでしょう(もしかした
ら、国家を発展させるという政治家の最低限の役割も放棄している可能性があり
ます)。自民党は、様々な問題を抱えていたとはいえ、科学技術無しには生きら
れない日本の特性を知って、科学者との信頼関係を築き、国家発展の基軸と
して科学研究推進を採用していた、ということになります。

 政治家の気まぐれで、科学技術の推進・遅滞をコントロールすることは、長期
的には国益に反します。
 少なくとも日本の政治家は科学研究の推進には積極的に寄与するべきであっ
て、今回の事業仕分けのように抑制的に働くことは望ましくありません。
 民主党は、国益の増進という政治家の最低限の役割を果たすべきです。その核
は科学技術以外にあり得ません。
 国益軽視・科学軽視の政党でも政権党になれるのであれば、憲法を改正するな
どルールを規定して、科学研究を聖域に戻す活動を展開する他ありません。
 

 基礎研究と応用研究という対立構造については、また。
 あと、国民へのアピール不足という意見、国民(世論)と科学者という関係に
ついても。



事業仕分けについて(1)

話題の行政刷新会議での事業仕分けについて。

 実は、私の所属プロジェクトも俎上に上げられ、多くの科学研究関連予算と同
様、要約として「縮減」という結果でした。学内関係者や所属学会から、今回の
結果について、文部科学省に意見を出すように依頼が来ました。しかし、お恥ず
かしいことに、自分での様々な立場が葛藤し、自分の意見をまとめることに難渋
しておりました。論を進めるごとに、別の立場の自分が現れ相克してしまって、
収拾がつかなくなっていたのです。

 思考がどこで縺れているのか、自分なりに考えたところ、「1人の国民として
の立場」「1人の研究者としての立場」「この事業で生活費を頂いている者の立
場」、の3つの立場があり、それぞれが葛藤していることが原因にあるようで
す。また、今までこのような事を深く考えることが無かった自分に呆れてしまっ
て、それがまた遅筆の遠因であったように思います。

 自己嫌悪はさておき、上にあげました3つの立場のうち、「この事業で生活費
を頂いている者の立場」は、至って私的な観点に起因する立場といえます。一方
で、今回の出来事を、私にとって深刻な事態にしているのも、この立場です。し
かしながら、このプロジェクトの来年度の採択がかなり厳しい状況にあります
し、また客観性を欠く要因とも成り得るので、ここでは潔く葬り去っても良いで
しょう。

 さらに立場を整理して論点を明白にして行きます。

 残る2つの立場「1人の国民としての立場」「1人の研究者としての立場」
は、どちらも軽視することができません。行政刷新会議は財務省の提案は発端で
ある様子ですが、選挙で選ばれた政権党が公認している以上、当然無視できるも
のはありません。民主主義のルールに則り、大きな影響力を持って然るべきだと
思います。よって、仕分け作業の結果も、国民の総意として、当事者は真摯に受
け止める必要があります。しかし、その結果が、本当に国民にとって良い将来を
約束するものなのかは疑問です。もし、民主党が公約を完遂するための財源を確
保することだけが目的であれば、民主党の選挙対策としか思えませんので反対で
す。一連の公約は、国民の将来を短期的な視点でしかとらえていない政策です。
科学の発展は国力の発展に直結していますが、成果の還元は長期的な視点で捉え
る必要があります。

 要するに、「即効性」をとるか「遅効性」を取るかの問題といえます。

 しかし、その2つしか選択肢が無いのだとしたら、国家の取りうる方針として
は、あまりに貧弱で心もとないと思います。そこを柔軟に考えてこそ、政治だと
私は思います。

 私は、麻生内閣の「定額給付金」の経験から「子供手当支給」の経済効果とし
ての即効性は期待できると思います。一方、科学の発展が長期的な国力の増進に
繋がることは、歴史が証明しています。例をあげると、「製鉄」「産業革命」
「兵器」「抗生物質」「エネルギー」等が該当します。より現代的な例では、IT
技術があげられます。デジタルディバイトは今や国家力の差を規定するものでも
あります。
 
 私は国粋主義ではありませんが、日本は発展し続けることの可能な数少ない国
の1つとして、今後も人類の発展を科学や文明で牽引していくべきと思います。
また、日本は資源が乏しく、科学技術分野での成功無くしては、やがて黒船に怯
える時代に後戻りしてしまうと思います。したがって、科学技術の分野で世界を
牽引していく事が合理的であることは明白です。

 しかし、民主党の考えは、「科学研究のような長期的な見返りのある政策は一
旦休止か遅らせてでも、即効性のある政策を優先したい」ということのようで
す。この一時的な休止が、後で挽回できるものか、それとも、気がついたときに
は、致命傷の遠因となるのか。

 未来がどちらに向けて進んで行くのか、多くの国民には判断材料がないと言っ
て良いでしょう。そこで、判断材料を持つ国民、すなわち科学者の意見が重要と
なるわけです。

 

2009年11月18日水曜日

Moodleでのファイル管理: ファイルサイズの上限(100Mb)の変更について

久々の更新です。
(親知らずを抜いて以来、落ち込むことが多かったけど、なんとか生きていま
す。。)

Moodleのファイル管理機能は非常に便利です。
私の場合、メールではやり取りするには大きなファイルのファイル共有にも使っ
ています。
ファイルのリストに、アップロードしたユーザの名前が出れば、他の追随は許さ
ないでしょう。

アップロード可能なファイルサイズは、2Mから100Mまで選択可能です。
100Mb以上に設定するには、下記の方法で可能です。 ちなみにOSはRHEL4です。

1. /etc/php.ini

post_max_size = 既定値
upload_max_filesize = 既定値

の既定値の値を、アップロードを許可するファイルサイズの上限に書き換えます。

post_max_size = 200M
upload_max_filesize = 200M

2. httpサービスのリスタート

/etc/init.d/httpd reload

以上で変更が反映されます。

1.のphp.iniの位置が分からない場合は、管理者アカウントでログインし、
サイト管理→サーバ→PHP情報 で表示される画面の、「Configuration File
(php.ini) Path 」で確認することができます。

お役に立てば。

まあ、自分のためのメモでもあるのですが。

2009年10月22日木曜日

メモ: CentOS ffmpeg インストール

su
wget http://dag.wieers.com/rpm/packages/rpmforge-release/rpmforge-release-0.3.6-1.el5.rf.x86_64.rpm
rpm -Uvh rpmforge-release-0.3.6-1.el5.rf.x86_64.rpm
vi /etc/yum.repos.d/rpmforge.repo

enabled = 1

enabled = 0

yum --enablerepo=rpmforge install ffmpeg

2009年10月2日金曜日

Dell Latitude D520 CentOS バックライト消去

今日は親知らずの抜歯の後が腫れて痛みます。疼痛に耐えかねどうも研究に集
中できません。そこで、最近行ったサーバ管理のメモを公開することにしまし
た。お役に立てば。

 Windows端末として使用していたDell Latitude D520をLinuxサーバに転用す
ることにしました。
OSはCentOS5.1(x86_64版)です。インストールはグラフィックドライバのところ
に注意。下記のブログなどが参考になりました。

■My Memoday 「NVIDIAグラフィックドライバ x86_64 Linux」
http://blogs.yahoo.co.jp/touchan_since1971/44838044.html

 上のサイトにある方法ではinit 5でx をスタートさせていますが、それでダメ
ならstartxで起動するはずです。
 
 サーバ用途ですので、基本的に常時稼働です。しかし、バックライトは消えて
欲しいものです。その設定にはacpiを使用します。

/etc/acpi/events/video.conf

にある、

#event=video.*
#action=/usr/sbin/vbetool dpms on

上記2行を、有効にします。

event=video.*
action=/usr/sbin/vbetool dpms on

以上の設定で、蓋を閉じるとバックライトが消灯するようになります。めでたし。
 かつての愛用機Inspiron 8000はバックライト常時点灯のままサーバ運用して
いた。当然、液晶が駄目になりました。若かりし頃の遠い思い出。

 なお、bootの際のカーネルオプションでacpi=off, apm=onとする設定が、いく
つかのWebサイトにありますが、この機種などでacpiをoffにするとCPU
(Core2Duo)がシングル・コアとして認識されてしまうので、ご注意。


 
 



Nebula3 セットアップ on CentOS 5.1

Moongiftで紹介されていたWebファイルストレージサービスNebula3のインストー
ル・メモ。OSはCentOS 5.1 x86_64版です。
完全に消化しきれたわけではありませんが、使える状態になりましたので、メモ
を公開します。
パスワードは?やxで伏せてあります。もちろん任意ですので適当な値を入れてく
ださい。

■Moongift記事「Webベースのファイルストレージ「Nebula」」
http://www.moongift.jp/2009/09/nebula/

■Nebula3 -free web file stroage in PHP
http://postfactum.pl.ua/nebula/

0. ファイル取得・配置

wget http://postfactum.pl.ua/nebula3/download.php?q=f06f5166df01d0bfad28ba4cc434a71c

bzip2 -d nebula3-stable7.tar.bz2
tar xvf nebula3-stable7.tar.bz2
su
mv nebula3 /var/www/html/ (ディレクトリは任意です。ここでは/var/www/html
にインストールしたとします)

1. 必要なシステム、ライブラリ等のインストール

su
yum -y install mysql
yum -y install mysql-server
yum -y install httpd
yum -y install php
yum -y install flex libxml2-devel
yum -y install zlib-devel libpng-devel
yum -y install libjpeg-devel
yum -y install php php-mysql php-mbstring php-pear php-gd

2. mysql, apacheサービス開始

/etc/init.d/mysqld start
/etc/init.d/httpd start

3. mysql設定

mysql -u root
/>UPDATE mysql.user
/>SET Password=PASSWORD('????????')
/>WHERE User='root';
/>FLUSH PRIVILEGES;
/>DELETE FROM mysql.user WHERE user='';
/>FLUSH PRIVILEGES;
/>GRANT ALL ON *.* TO nebula3
/>IDENTIFIED BY 'xxxxxxxx';

mysqladmin create nebula3_files

4. /var/www/html/nebula3/config.php の編集

$envir['mysqlpassword'] = 'nebula3password';
$envir['mysqlnebuladatabase'] = 'nebula3';
$envir['nebulasite'] = 'http://nebula3/';

$envir['mysqlpassword'] = 'xxxxxxxxx';
$envir['mysqlnebuladatabase'] = 'nebula3_files';
$envir['nebulasite'] = 'http://サーバURL/nebula3/';

に変更。


4. 下記webサイト「CentOSサーバ構築術 文具堂」を参考にphpMyAdminをインス
トール
http://centos.bungu-do.jp/2007/05/centos_mysql.html

※上記リンク、不都合でしたらご一報下さい。

5. 80番ポート開放
System->管理->セキュリティレベルとファイアウォールの設定->rootパスワード
入力->ファイアウォールのオプション->WWW(HTTP)をオン-> OK

6. phpMyAdminからnebula3.sqlをインポート

ブラウザでhttp://サーバURL/phpMyAdmin/
ID: root
PW: ????????(mysqlのrootのパスワード)
nebula3_files->インポート->テキストファイルの位置->
/var/www/html/nebula3/install/nebula3.sql を選択->「実行する」の順で押下

7. /var/www/html/nebula3/usersのアクセス権など変更
chown apache /var/www/html/nebula3/users
chgrp apache /var/www/html/nebula3/users
chmod 755 /var/www/html/nebula3/users

8.ブラウザで下記URLにアクセス
http://サーバURL/nebula3/

管理者ID(admin)で初期パスワード(admin)でログイン

9. 管理者アカウントの初期パスワードを変更

Home画面右上「Options」を押下すると設定変更画面に入ります。新しい
Passwordを入力し「Save」を押下。

[所感]

1. 期待していた複数ファイルの一括アップロード機能は無かった。
2.アップロードの際のウィルスチェック機能もなかった。
3. フォルダ作成機能もなし。ファイルアップロード時にTagなどを付けてTagsや
Searchで収集するという使い方らしい。
4. 日本語ファイル名はアップロード、ダウンロードともに問題なかった。

管理者側の視点としては、長期使用を前提とした場合、ウィルスチェック機能や
フォルダ作成を実装したMooldeのファイル管理システムの方がすぐれていると感
じる。短期的には実装が簡単なnebula3に軍配が上る。
また、ユーザの使いやすさからでは、機能が単純化されたNebulaが一枚上。ド
キュメントもシンプルに書けるだろう。
あと、アップロードしたユーザが誰か分るのが良い。またWeb上のremoteファイ
ルも管理できるのも大きな利点と言える。
家庭用など、個人的な使用に向いている。というのは、仕事で使うファイル管理
システムはウィルスチェック機能がないと、やはり厳しいためだ。

【追記】
どうやらアップロード可能なファイルサイズに上限があるらしい。2MB以上のファイルをアップしようとすると、「Please specify file name」または「File uploading error」とでる。どちらのエラーメッセージが出るかは、ファイルサイズによるらしく、分水麓は8MB前後とみたがどうか。稼働中のMoodleは100MBまで。上限2MBでは、今時写真の置き場にもならないね。どうしたものか。


2009年9月29日火曜日

本日の御言葉

-もし計算が候補分子を実際に合成し試験するのに比べて長い時間を要するなら
ば、少なくとも実用的な観点からは計算を行う意味はほとんどない。-

「分子モデリング概説(AR.リーチ著 地人書館)」 p569より。最近のペプチド自
動合成機は性能が良いらしいので、生理活性ペプチドのin silico設計は廃れて
いく運命なのでしょう。はぁ。

2009年9月25日金曜日

分子モデリング・シミュレーション考(2)

 しかしながら、生体分子系のモデリングを前提とする場合、量子化学計算は必
ずしも第一選択ではない。その理由はたった1つで、その膨大な計算コストのた
め、である。モデリングの対象となる生体分子は、酵素やたんぱく分子の複合体
といった、ある程度の大きさを持った分子であることが多い(もちろん、特殊な
研究やレポート課題などで、DNAやペプチド等の小さな分子を扱うことがある
が、これらは研究おいては稀なケースと捉えて差し支えない)。なお、かつての
量子化学計算では、計算に溶媒や温度の効果を考慮する場合に理論的な整合性や
実装コストの高さが問題となっていたが、多数の理論構築(しばしば「理論武
装」とも呼ばれる)とそのアルゴリズム化によって、ある程度達成している。し
かしながら、計算機の性能も大幅な進歩を遂げていはいるが、実験家を説得させ
るに充分な大きさの生体分子の量子化学計算には、圧倒的に不足している。計算
コストの問題は、研究計画に重大な影響を及ぼすため、この手法を扱うことは慎
重にならざるを得ないというのが現状である。なお、半径経験的分子軌道法をに
代表される大胆な近似法を採用した計算理論によって、計算コストの削減が試み
られているが、標準的な方法は確立されていない。
 現実的な観点(主に上述の計算コストの問題)から、生体分子をモデル化する
場合、分子力学法がスタンダードな方法となっている。分子力学法は、分子力場
法とも呼ばれ、系のエネルギーをシンプルなポテンシャル関数で表現する方法で
ある。シュレーディンガー方程式に対し、徹底的に単純化されたこのモデルは、
計算コストを大幅に節約できるため、生体分子を始めとする大きな分子系のモデ
ル構築に適用される。

2009年9月14日月曜日

休日日記

■9/12 雨のち曇
1) 家内が新型ipod nanoを購入のため、家族3人で駅前の大型電器店Bへ。カ
ラーを中心に実物をチェック。touchの無線LANにも惹かれたようだけど、100g超
の重量に断念。nano 16 GB ブルーに決定。
2) 電気屋Bのあと、格安のお寿司やさんへ。さんまがおいしい季節となりまし
た。娘の好物のレパートリーはいくら、まぐろ、ほたて、いなりずし。勢いあ
まって家内のかつおをつまみ食い。ショウガを口に含んでしまった。。
3) 家内の美容院の時間が迫ってきたので、駅前からタクシーで帰宅。話の面白
い、そして丁寧な運転手さんでした。感謝。
4) 家内が留守にしている最中、娘とお昼寝。特に寝かしつけはしなかったが、
添い寝だけで眠ってしまった。至福に感謝。
5) 2件目のお店Dで在庫を確保しておいたブルーの16Gを無事に購入。家内が土壇
場で「紫のを見たい」と言い出す。すると、突如その場にいた店員たちに緊迫が
走った。理由は定かでないが、「紫は他のお客の予約済みだから見せるだけで。
絶対に売るな」「ブルーと紫はよく似ているから気をつけて」といったところだ
ろう。
6) 発売が突然だったようで、今回のリニューアルの内容をきちんと理解してい
る店員さんは皆無でした。私が「新型nanoに、スピーカー、ついたんですよ
ね?」と聞くと、「この機種はイヤホンで聞きますから。。」等と頼りなさげに
返答されました。あまりにアピールが少なく目立ちませんが、スピーカー、つい
ていますよ。音楽はもちろん、FMラジオ、ビデオの音声も出せます。何かと便利
です。

P.S. しかし、静止画が撮れないのは、なぜでしょうか。技術的には可能な筈で
す。やっぱり盗撮マニア対策かな?「新型ipodで盗撮!」なんて新聞記事が出た
ら、Appleのイメージが損なわれるだろうから、意図的にデジカメ機能をキック
アウトしたのでしょう。しかし、卑劣な行為を取る人間には静止画動画は関係な
いとも思えます。一部の人間の品性の低下が文明の発展の足を引っ張っている。
卑近な例だけど、どうも当てはまりそう。とても残念だ。

■9/13 晴
1) 農園にぶどう狩りにいきました。昨年に続き2回目。
2) 大きめのを2房+入園料(ぶどう試食付き)で、約3000円。
4) 品種はマスカット・オブ・アレキサンドリアと「翠峰」。残念ながらニュー
ピオーネは全体的に小振り。長梅雨だったせいかな?
5) 試食でおいしかったのは、「紅かおり」。ぶどうなのに、砂糖の香りがします。
6) 農園のお兄さんの、ぶどうへの熱い思いが伝わりました。おかげで枝を切断
する時に緊張してしまった。
7) できれば10月にもう一度行きたいなあ。去年のピオーネよ、もう一度!
8) 帰りの車中、家内のipodから森山直太朗さんの「夏の終わり」が流れまし
た。この季節の夕暮れにとても良く合う、佳曲です。
9) それにしても、娘ひとりで何十粒食べたことか。。農家の方に感謝せいよ。

P.S. 晩夏の寂しさを秋の味覚で紛らわすような、そんな休日でした。食べてい
ればご機嫌、というのは娘だけでは無いようです。

テスト LaTeX for Blogger(4)


テスト LaTeX for Blogger(3)

2-4ac}}{2a}" border=0 align=middle />

テスト LaTeX for Blogger (2)

$$x=\frac{-b\pm\sqrt{b2-4ac}}{2a}$$

テスト LaTeX for Blogger

$$x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}$$

参考:
http://www.kuribo.info/2007/06/blogger-latex-greasemonkey.html

2009年9月10日木曜日

分子モデリング・シミュレーション考(1)

まあ、専門として当たり前のことしか書いていませんが、自分の言葉で書くこと
が重要、ということで。

####

バイオインフォマティクスの一連の講義において、本"考"項は立体構造解析に分
類される。
立体構造の情報解析は静的構造解析と動的構造解析の2つの支流があり、相補的
な発展を続けている。

たんぱくや核酸が分子である以上、それらの構造を定義するのは、分子を構成す
る原子の三次元座標(x,y,z)である。
解析対象の実験値として、まず原子の座標が与えられた場合、行うべきは、分子
のモデリングである。
そして、モデリングとは対象を数式で表現することに他ならない。

 生物系の雑誌や書籍でよく使われれる、たんぱく分子のコンピュータ・グラ
フィックを見たことがあると思うが、
これは分子モデリングとは言わない。ソフトウェアでモデルを視覚化しているに
過ぎない。モデルとはあくまで数式である。

 分子モデリングには、構造のモデル化と振る舞いのモデル化の両者が必要であ
る。前者だけで済ませる場合もあるが、
振る舞いをモデル化し、その分子の性質を深く理解するには、構造のモデリング
が不可欠である。

さて、どのように数式でモデル化するか。
物理の授業ででてきたに違いない。今更隠すことはないだろう。
我々人類は、既に答えを得ている。シュレーディンガー方程式である。

シュレーディンガー方程式は、量子の振る舞いを記述する方程式である。
量子とは不連続な運動、不連続なエネルギー状態を持つ粒子のことである。
このような性質を備える粒子は、皆さんの世界では、電子が挙げられる。
分子は原子で構成されているのはご存じの通りで、原子は陽子と電子で構成され
ている。
陽子はさらに素粒子に分けられるが、分子モデリングでは、そこまで考えること
は、通常ない。

 与えられているのは、すなわち実験的に決められるのは、原子の座標である。
実は、構造のモデル化そのものは、原子の三次元座標(x,y,z)で事足りる。しか
し、多くの場合、分子の振る舞いを記述する必要がある。そして、分子の振るま
いを支配しているものは何か。むろん、原子であるが、これに加え、電子の状態
をモデル化する必要がある。シュレーディンガー方程式は、量子の振る舞いを記
述する量子力学のモデルであるが、分子を構成しているのが電子であり、また電
子は量子であるが故に、分子のモデリングに応用されているのである。シュレー
ディンガー方程式を解くことにより、その分子の様々な性質、振る舞いを理論的
に予測することができる。

 シュレーディンガー方程式を分子モデリングに応用し、さらにその方程式を数
値的に解くことを、量子化学計算と呼ぶ。電子状態計算と呼ばれることもある。

####

1回で終わりそうだな。。

C大学での特別講義 スクリプト

今年の春に初めての英語で講義を行いました。その時に準備したスクリプトをメ
モをここに貼っておきます。
結局、本番ではスクリプトは使わず、ほぼアドリブでこなしましたので、話した
内容とは随分と異なりますが。
誤字・脱字などはそのままです。スライドは敢えてだしません。

Slide 1.
Thank you very much for the introduction of me, Tamura-sensei.
Today, I would like to give you a lecture on fundation resources for
bioinformatic analysis.
All the resources providing here are available on world wide web, so you
can access these materials everytime, anywhere even if in GOLDEN WEEK.
So let me start my part of this lecture.

Slide 2.
Firstly, I would like to confirm the definition of bioinformatics.

I think almost of you know that this type of workout is how to apply
informatics or mathematics to solve problems suggested by biologists.

Explanation from other side is also available. That is How to explain
biological phenomenon by processing of biological data by use of
computer informatics technology

This means "bioinformatics" itself is arose from two field of approach.
So, we recognize bioinformatics is a category of informatics and a
category of biology.
This is not serious matter because this field of sciences is developed
by information science and biology.

This field is also known as "Computational Biology". Probably you know.
But today I would like to call it "bioinformatics".

And also, please note that definition of bioinformatics is different by
standpoint or educational background of each researcher. There are many
definitions. Someone say that bioinformatics is a time-scale biology
because the results are tightly connected to time such as million years
to picoseconds.

Slide 3.

This slide shows list of goal, merits and demerits of bioinformatics.
One of goal is building new hypothesis from the collected experimental data.
Not only for processing on biological data. Processing of experimental
data is just a first step of bioinformatics research at least I believe.
And also, Narrowing down of potential direction for next step of related
experimental study. Bioinformatics is very expected filed of work
especially for collaborative research.

Selected merits are described here.
In generally, bioinformatics analysis is reproductive if you want to
repeat it.
And computers are not expensive facility nowadays.
Everyone take same result by same method.

Demerits and pitfall are here.
Experimental data is needed for preferred analysis.
If you have no appropriate experimental data, you cannot kick off the
research or obtain correct results.
And you should note that part of result by bioinformatics research is
just a prediction, so results should be checked by experimental studies
if possible.
And you have to study hard may field of area, both of computational
science and web resources and progress in biology.
Finally, computer performance is very important.

Slide 4.

This slide shows a category map of bioinformatics.
Bioinformatics consists of three part of subcategory described here.
Representative work is Sequence analysis.
And structure informatics is also important especially for biomedical
sciences.
New field of work are arose in near decade called "Network biology"
Additionally, text-mining is also interesting work for medical science.
I review the part of subcategory to check their properties

Slide 5.

Sequence based informatics consists of sequence analysis such as
molecular evolution and comparative genomics.

This is the main stream of bioinformatics nowadays.
It is based on collaborative work by International banks of DNA or
protein sequence.
Also Accelerated by advancement of biotechnology of DNA, protein sequencing.
For technology of sequence analysis, natural language processing
effectively assisted.

Text mining is the natural language processing on biomedical literatures.
This field included in the part of sequence analysis because these
fields are tightly bound by method and technology.
Researchers of text-mining sometimes get into field of sequence analysis.

Slide 6.

Structure based informatics composed of three categories listed here.
These are 3D structure analysis, chemoinformtics and molecular
simulation technology.
Any molecule and biopolymers off cause consists of atoms.
So any structure of biopolymer even so macromolecule can be described by
atomic positions.
So, this field provides most microscopic resolution.
Progress of this type of bioinformatics is based on application of
physical chemistry such as thermodynamic theory and quantum chemistry.

In general any types of molecules in the cell can be targeted by
structural informatics.
For example, glycoprotein and lipid membrane can be treated by similar
manner to protein or DNA
Because the structural informatics handles atomic coordinate of molecule.

This field is focused on not only evolutionary interests also demand on
drug development.
You should note that this type of bioinformatics, especially for
molecular simulation are very costly and time-consumed. High-end type of
cluster servers are necessary.

Slide 7.

Network (pathway) based informatics is consists of expression analysis
represented by microarray informatics and systems biology.
Network type bioinformatics is focused on change in cellular location
and what is the condition for the expression of gene products.
This provides higher order of biomedical information that binds to cell
biology.
Systems biology is newly rising filed of bioinformatics and have great
potential of impact.
Goal of this strategy is reconstruction of cell.
So application of the systems biology will be synthetic biology.
And also will be most comprehensive biology.
However, most of the systems biology method is in still developmental phase.
For application to biomedical research, many problems should be solved.
The representative problem is deficiency of parameters and lack of
fundamental equation to solve.

Slide 8.

This is category map of bioinformatics again.
Actually, these categories are not independent, they are linked each
other by method, technology and experimental data for processing.
For example, Structure and sequence analysis are tightly bound by the
important relationship based on their evolution and function.
And molecular simulation strongly depends on input 3D structure.
And also, sequence analysis and text mining are sharing the method and
techniques.
I recommend, you learn about linkage and interaction among the subgroups
in the bioinformatics, to deeply and systematically understand the
bioinformatics researches.
Today's lecture is focused on sequence analysis and structural informatics.
And I would like to review in Japanese.

Slide 10

From here, I would like to introduce fundamental resources for sequence
analysis.

There are three types of sequence resources on WWW.
Data Bank type is primary database.
The databank accepts submission by someone who determines the sequence
of DNA or protein.
Some journal requests data submission before publication of article of
the sequenced material. This rule is named by hold until published (HUP).
However, quality of sequences in databank is not enough so much.
Sometime it includes error or miss significant information

Annotation type is a curated database to keep the quality of contents.
It is based on sequence bank and annotation work and clustering were
applied the databank contents. Method and target of annotation depends
on the database policy.
Almost of them are freely available.

Finally, I have to mentioned sequences in patent article.
DNA, protein sequences are also found in patent form.
There are basically opened by national department for intellectual
property of each country.
However, these types of data are not easily for handling and searching.
If you have to deal with patented sequence, patient work is needed.
Please note that HUP described above are not applied to the patented
sequences.
Patent owner do not have to submit to the public sequence bank.

Slide 11

I think you know Genbank of NCBI that is the representative data bank
for DNA sequences.
And also, DDBJ (DNA Data Bank of Japan) and EBI (European bioinformatics
institute ) are also established.
These DNA banks are sharing the sequence and annotation data through the
internet.
Update interval is everyday.
You have ever seen the DNA accession number in the databank such as
listed here.
One alphabet and 5 digit number is older entry.
More recent one has 2 alphabet and 6 digit number.
Number after the point means revised time of the sequence or contents of
annotation.

Slide 12.

Next one is databanks for protein sequences.
Three protein resources are well known and unified into international
databank called Uniprot. Uniprot itself mean "universal protein resource".
One of these is the protein information resource at Georgetown University.
Swiss-Prot hosted by EBI and Swiss Institute for bioinformatics (SIB)
provides only protein sequence directly determined by experimental sequence.
TreEMBL of EMBL amino acid sequence predicted from coding region of DNA.
Update interval is for 3 or 4 weeks.

Structure database also provides amino acid sequences.
Basically, aim of this type of databank is providing structures of
biomolecules, not for sequences.
However, you can utilize them as a possible protein sequence resources
off cause.
Details in Protein data bank are presented by latter slides.

Slide 13.

Annotation type database is reliable sequence resources with unique
annotation and it cover the pit falls of bank type data bases.
Data banks type is not user-oriented because of the sequence redundancy.
The problem is more serious when the clustering was not applied.
Too many identical sequences are stored as different entries.
That arise confused situation for browsing annotation and sequence analysis.
And also, sequencing error is unfortunately still surviving in the
databanks.

Annotation type has solved these problems.
Sequence-based clustering was applied to remove the redundancy.
And additional information on the sequences is provided by annotation work.
Annotation is related to gene family, evolutional information, 3D
structure motifs and so on.
Errors in sequence are corrected by annotation work such as trimming of
vector sequence contamination.
So I recommend using annotation database if you want to skip these
patient processes on sequence analysis because annotation database is
user-friendly and reliable resource.

Slide 14.

Representative annotation databases are listed here.
RefSeq at NCBI is well known annotation database on world wide web.
Details are presented in the next slide.
EnsEmbl hosted by EMBL, EBI and WTSI (Wellcome Trust Sanger Institute)
provides genome based annotation
H-Invitational database is annotation database for human full-length cDNAs.
UCSC (University of California Santa Cruz) genome site is genome-based
annotation database.
In general, coverage of biological species is different by their
annotation policy.
For example, RefSeq covers thousands of species but annotation is not
enough for effective data mining.
Ensemble provides more detailed annotation such as coding region of
alternative splicing and covers 30 model species and Homo sapience.
However, if genome sequencing is not completed, certain number of gene
is missed in the database.
H-Invitational DB is restricted to human genes only.
But the annotation is very deeply and comprehensive and gene count is
almost completed because they use all the transcripts of human genome.
Human curation work is applied for the annotation quality.


Slide 15.

Next, I would like to check what is annotation.
The simplest definition is just adding information on sequence and genes.
Actually, annotation by use of computational processing is based on
sequence analysis software and checking output by human curation.
Clustering of sequences is also important for construct "gene" and gene
family.
Linking to external resources is also a first step of annotation.

Narrow definition is functional annotation of gene by use of sequence
similarity search against homologous gene with known function.
Mapping to genome is also important to locate locus of genes.
Assignment of gene family and estimating taxonomic coverage are
evolutionary annotation.

Standard definitions are detection of repetitive sequence, subcellular
localization motif , expression profiles and mapping to metabolic pathway

Broad definition are linking to other databases and correction, edit of
sequence and so on.

Slide 16.

Current de facto standard of annotation database is RefSeq hosted by NCBI.
Sequence set is derived from GenBank.
Coverage of biological species is widest.
Vector sequences are removed from the original sequence.
Redundancy is also removed. An unique identifier is assigned to
identical sequence.
Update is regularly at interval of 2 or 3 month.
Entrez Gene database (formerly called as Locus Link) are build in NCBI
web site. This database provides genomic position and cytoband of the genes.
Gene map viewer is available for almost of model organisms.


Slide 17.

This is the list of patent databases.

USPTO is United States patent and trade mark office.
This department hosts a database of patented DNA.
But sequence search is not available.
Patome DB is based on sequences of WIPO and PSIPS database.
Gene ID, Gene symbol search is available.
PatGenDB has sequence search engine but not free database.
PSIPS is a public database maintained by USPTO.
Sequence data of WIPO can be downloaded.
Public database listed here are not designed for bioinformatics analysis.
So, patient processing is needed if you utilized them for bioinformatics
analysis.
But this type of database should not be ignored.
Please note that, according to PatomeDB article in Nucleic acid research,
55% of DNA sequences are linked to one or more patents.
I believe rate of patented sequence will be increased.

That is all for outlines of biological sequence resources in today's
lecture.
I will take your question.

Slide 18.

Next, I would like to talk about how to read data format of the sequence
resources.
Data format means data structure defined by computer program or database.
I think that is basic thing.

Programs, databases can define unique format for the processing.
Format converting programs basically free but almost of them can be
operated by UNIX and Linux.
Some major format is supported by programs running on Windows. But the
Windows version is not freely available.
Also, please not that some of format are not text file. Binary format,
only computer can read it is used sometime.

Here is the list of format mainly used in sequence analysis.
For DNA sequence and annotation, GenBank, EBI flat file format is widely
used.
DDBJ also provides unique format but almost same as GenBank format.
UniProt, PDB file format is also important for amino acid sequence but
FASTA format is most frequently used for the bioinformatics sequence
analysis.
I think almost of Web services and software for sequence analysis can
accept FASTA file format.
Download data of sequence is also FASTA file.
Today, I would like to talk about FASTA sequence format.

Slide 19.

Example of FASTA format is described here.
This example holds DNA sequence but it can be used for the amino acid
sequences.
FASTA file is originally input file format of sequence comparison
program FASTA.
I think you know BLAST. FASTA program is same type of sequence analysis
program.
First line is called "header" line. It starts "greater-than " angle
bracket symbol.
Header line includes sequence ID, and short annotation and so on.
Sequence is defined by a series of single letter.
Capital letter and lowercase are also used for the representing building
block.
For nucleotide sequences, the building blocks are listed from 5' to 3'.
For amino acid sequences, listed from N terminus to C terminus.
Number of characters is not restricted, but lower than 80 characters is
preferred.
For amino acid sequence, asterisk means a stop codon.
Double slush denotes the end of sequence.
Number of sequence in a FASTA file is not restricted.
If it contains only one sequence, it called single FASTA file.
Two or more FASTA file, it is referred to as multi FASTA file.

Slide 20.

In general, the building block of nucleic acid in sequence is
represented by A T G C and U.
However, for nucleotide sequence in FATSA is not only ATGCU.
There are many nonstandard representations for a building blocks listed
here.
There are defined by IUPAC naming rule.
R means G or A, purine type nucleic acid.
Y means T or C, pyrimidine nucleic acid.
I do not speech remained special characters but these are rarely
observed in FASTA files.
If you want to make a program for processing nucleic acid, you have to
cover this type of characters.
The special characters in complement strand are not solved.
These are hard to process.

Slide 21.

Sequence comparison is main stream of sequence analysis.
So please check the aims, goal of sequence comparison.

Discovering a gene.
For example: Prediction of transcribed region on genomic sequence.
Prediction of gene function for Function annotation based on sequence
similarity with known genes.
It can be used for classifying sequences. That process is also known as
clustering
To define gene family and to locate functional motif.
Prediction of evolutionary relationship by sequence comparison.
That result in construction of phylogenetic tree.
Linkage between sequence and phenotype.
Phenotype prediction based on SNP, microsatellite.
Also used for quality check on sequence. Trimming DNA of cloning vector,
Detection of frame-shift error and so on.

Slide 22.

There are several options for sequence comparison.
If the similarity between your sequence and target is expected, you just
aligned your queried sequence against target database or sequences.
In general, alignments are categorized into 2 types.
Pairwise type of alignment is made by two sequence comparison.
Multiple sequence alignment is made by three or more sequences.
Sequence alignment can be generated if the sequences are closely related.
Of course, it is also utilized to find out identical sequences in the
database or genomic sequence.

If your queried sequence is distant from the target database,
You will try to make pairwise alignment by PSI-BLAST
Please note that PSI-BLAST can be applied to amino acid sequence.
If you could not find any result by PSI-BLAST, you can try again by use
of alternative method based on machine learning theory such as hidden
Markov model, artificial neural network, support vector machine and
genetic algorithm.
These methods are effective to find out distantly related sequence.

You can choose option one or option two.
Point to regard is your knowledge on what is the sequence derived from.
For example, biological species is very informative.
Basically, you try the method one and if non of result is responded, you
try PSI-BLAST and other method such as machine learning theory.

Slide 23.

I would like to explain the fundamentals of algorithm for pairwise
alignment.
In 1970, Needleman and Wunsh have applied dynamic programming method to
making pairwise alignment from two related sequences.

Dynamic programming itself is based on simple idea.
Create a dynamic programming matrix based on substitution matrix.
Locate the optimal score and the alignment is traced from here to origin
of matrix through the shortest path.

Smith-Waterman algorithm is an applied version of dynamic programming
for local alignment. Smith-Waterman algorithm was implemented in a
program S SEARCH.
Details of Smith- Waterman algorithm will be explained later.

In 1988, FASTA program was developed by Pearson.
This program computes E-value of alignment. This value is utilized for
assessment of alignment instead of alignment score.

At least in 1990, BLAST program is published by David Lipman.
This program is faster than FASTA. Sensitivity of BLAST is decreased by
tread-off with the higher performance.
Several versions of BLAST children were created.
NCBI BLAST is most frequently used and implemented in lot of Web
services as sequence search engine.

Slide 24.

Next slides show you the algorithm of BLAST.
Basically, logic of BLAST consists of four steps.
Cut, Align, Stretch and Combine.
First three step in corresponds with Smith-Waterman algorithm.
For nucleotide sequence, complement sequence of query is generated and
aligned to target sequence.

I would like to explain more detail by use of the pair of the sequence
described here.

Slide 25.

First step of the BLAST algorithm is splitting the query sequence into
fragments called "Word".
Sequence length of Word can be modified by users.
In this sample word length was set at three.
So the queried sequence is split into three fragments NCI, AMQ, and MPY.
In similar manner, frame-shifted words are also created as described here.

Slide 26.

Second step of the BLAST is to align the Words against subject sequence.
Subject sequence is the target sequence in BLAST.
The matched island is called "Word hit" or "Seed".
Insert or deletion are not inserted in Word hit.
There is a different between BLAST and FASTA for generation of Word hit.
In BLAST, mismatches are allowed in Word hit
In contrast, FASTA allows exact match only.

In this case, Word hit of "AMQ" is created.
This will be used for scaffold of longer alignment.

Slide 27.

In third step, Stretch the Word hits to extend the coverage of queried
sequence.
Alignment score is calculated and if score is no longer improved, stop
the stretching.
How to calculate the alignment score will be explained later.

In this sample, NCI for N-terminus and MPQ for C-terminus are generated.
In the extended region, sequence mismatches and gasp are allowed.

Slide 28.

Finally, combine the extended word hits.
Gap is not allowed for combining the Word hits.
In this case, YRI were inserted into the space before the neighborhood
"Wordhit".

The process is iterated until no more word hits is combined.
If the query sequence is nucleotide, complement strand of the sequence
also aligned in similar manner.


Slide 29.

Main output of BLAST is pairwise alignment.
To assess the result of sequence comparison, the obtained alignment is
checked precisely.
For evaluation of alignment, several numerical are calculated and
printed to the output.
Score is sum of reword and penalty of the alignment based on
substitution matirix.
Row score is plane type of the alignment score.
Bit score is another type of alignment score that counts background of
amino acid composition of target sequences.
Higher score means fine similarity.
Expected value is well known measurement for assessment of sequence
alignment.
Details will be explained latter slides.
Lower E-value represents higher significance.
P-value is another statistical value and denotes probability of an
alignment occurring by chance.
Sequence identity and coverage are helpful for special situation.

Sample of pairwise alignment is described here.
Alignment length is length of aligned region including gap sites.
Unaligned regions are out of the aligned region.
Block means in serial matched sited in the alignment.
Sequence match is identical match or accepted mutation.
Accepted mutation is substituted site by chemically-equivalent residue
and restricted to amino acid sequence alignment.
Gap site are insertion and deletion. Sometime these are called "Indel".

Slide 30.

This slide shows details of raw score.
To count raw score, substitution matrix is utilized.
For amino acid sequence alignment, there are two major types of
substitution matrix called PAM and BLOSSUM.
Users can choice the matrix.
For nucleic acid alignment, no matrix is utilized.
Please note that score depends of sequence length.
In Blast output, alignments are sorted by raw score.

Slide 31.

E-value is probability of the alignment in the database.
This means appearance of the alignment by chance against the background
database.
So the non significant alignment represents higher E-value.

E-value is calculated by the formula.
M is queried sequence length and N is all of sequence length in the target.
So E-value depends on search space.
K and lambda are varied by used substitution matrix.
K is 0.14 and lambda is 0.318.
S is raw score.

Please note that if E-value is higher than e point minus 10, functional
similarity is expected.
So Cut off of E-value sets e point minus 10, if you want to find genes
with similar function.

Slide 32.

Identity and coverage are most simple values for alignment quality.
In the case of nucleotide sequence, Gap is counted as mismatch.
For amino acid sequence, Gap is ignored for the count of mismatch.
But an accepted mutation is counted as mismatch.
Sequence coverage is two values for an alignment, because sequence
length query and target can be treated as dominator of coverage.

For example, this is the amino acid alignment case,
Sequence A is twenty five-amino acid long and B is 18-amino acid long.
In the pairwise alignment, alignment length including gap is 18. Count
of exact match and Gap site is 11 and 1 respectively.
So the sequence identity is calculated to be 61%.
Coverage for sequence A is 76%. And coverage of B is 100%.


Slide 33.

I would like to introduce a problematic case of alignment.
Sometime position of gas is not determined at unique position.
There are some possible site to insert the gap.
In this case, gas can be inserted into both of 13th and 14th. Both are
correct answer.
There is no exact solution to determine the gap site.
Programs output only one possible alignment.

Slide 34.

This also problematic case, but it is not serious so match.
There are two possible sites in the cytosine for the sample alignment.
Please note that longer gap insertion is considered as more natural
according to inspect of evolutionary biology.
To correct the non-preferred alignment, adjusting gap open and gap
extension penalty is an effective solution.
To force preferred alignment, increase open gap penalty and just perform
BLAST again.

Slide 35.

Please note that similarity and homology is almost same but not
equivalent term.
Similarity means that a shared character observed and it expressed by
high or low.
In contrast, homology means sharing biological ancestor and having
evolutionary relationship. And this term is not gradual.

For example, similarity between genome sequence and mRNA sequence.
This is not homology just a similarity.
And similarity between same gene family can be expressed as homology.
Database search provides like BLAST anytime called as "Homology search".
But this is not correct expression. It's just a similarity search.

Slide 36.

If you want to try sequence search for distantly related sequences,
please refer to this slide.
These strategy are higher sensitivity than plane type of BLAST and FASTA.
I think PSI-BLAST is first choice for this type of object if you search
amino acid sequence.

Slide 37.

This slides shows algorithm of PSI-BLAST.
This type of BLAST variant is iterative search using amino acid profile.

Slide 38.

Here is timeline of sequence analysis.
Please check it if you interested in.

Slide 39.

So, next up is presentation of the fundamentals of structural
bioinformatics.
That's all for sequence analysis resources.
Ant question.
I summarized the point of sequence comparison method in Japanese.

Slide 40.

Categories of structure analysis are roughly classified into static
structure analysis and dynamic structure analysis.
Static structure analysis is museum type science and Dynamic analysis is
theoretical science.
Target is same but the concepts of them are not shared quite, so much
separated.
Today, I would like to mainly focus on static structure analysis.

Slide 41.

Basically, 3D structure is assemble of atomic coordinate represented by
X and Y and Z.
Unit of atomic coordinate is Angstrom.
Atomic coordinates of biological molecules can be determined by
experimental studies such as X-ray analysis and NMR spectrometry.
And also, 3D-structure prediction can provide atomic coordinates.
Atomic coordinates are analyzed by static and dynamic method.
Ultimate goal of a series of the analysis is related to Drug discovery
and structure prediction.

Slide 42.

These are information resources of atomic coordinates or structural
annotation on biological molecules.
Protein databank, Nucleic acid database provides information on atomic
coordinate of biomolecules.
These row data were analyzed and annotated by users. And the results are
released from their web site.
For annotation database, PDBsum hosted by EBI is representative.
And for structural classification, SCOP and CATH are established in the
early age of structural bioinformatics

Slide 43.

Protein databank is established in 1971 at Brookhaven national institute.
Current PDB is international collaborative work.
RCSB at USA and PDBj in Japan and MSD of EBI is joined to activity of
"wwPDB".
BioMagRes Bank is also joined at 2006.
Just like international sequence bank, the four organizations share the
structural information determined by X-ray and NMR and electron microscopy.
Target is all of biological material excepted lipid.
Chemical compounds are also included in the structure information.
PDB code is 4digit such as 3BLM and 1A8P and so on.
One entry has one ID.
5th digit is alphabet. It means chain ID.
HUP rule is applied to publish to Journal.

Slide 44.

In present, PDB is managed by RCSB. RCSB is research collaboratory for
structural bioinformatics and it stores many structure entries.
RCSB consist of Rutgers University and UCSD super computer center and so on.
Current version of PDB provides helpful search system.
Keyword ,ID and sequence search are available.
Search system by chemical compound is also build.

Slide 45.

This slide shows the data growth and count of contents in RCSB PDB.
Currently, about fifty-six thousand entries are stored on PDB.
Almost of the entries is Protein.
For method, X-ray is major than other type of approaches.
Number of entry is acutely increased from 2001.
Please note that PDB is a databank type information resource, so
redundancy is not removed.
Hence number of entry is not equal to number of structure.
For example, when structure is identical but resolution of new one is
improved from the older entry, different ID is assigned to the new entry.

Slide 46.

This slide shows the merits and demerits of methods to determine the
structures.
Please note that X-ray data does not include hydrogen atom.
In contrast, NMR can observe hydrogen atoms.
However, NMR cannot be applied to macromolecule.
Limits are about three hundred of residues for protein.
NMR also can observe dynamic structure in the solution.
Electron microscopy can determine structure of super molecule such as
ribosome.
However, only backbone structures such as alpha trace are provided due
to the low resolution.

Slide 47.

This is the sample of PDB format.
Atom name and atomic coordinate are described here.

Slide 48.

PDBsum is one of representative structural annotation database, hosted
by EBI.
It provides structure pocket, molecular surface and Ramachandran plot
and ligand and cofactors in the PDB entry.
Sequence search and keyword search are available.

Slide 49.

Let me check the definition of protein fold.
For broad definition, protein structure defined by atomic coordinates of
all atoms in the molecule. Side chains are included.
Narrow definition is only trace of alpha-carbon atom in protein or
peptide bond.
In structure classification studies, narrow definition is frequently
applied.

Related terms are listed here.
Topology is position of secondary structure units.
And packing is assembling of secondary structure units.

Slide 50.

This is graphical representation of alpha trace and mainchain.
Mainchain includes peptide bond.
Basically, mainchain can be defined from alpha-trace.
Merit of alpha trace is computational cost.
Mainchain can define correct secondary structure.

Slide 51.

Classification of protein fold is performed based on the PDB entries.
Mainly, hierarchal classification is applied.
SCOP and CATH are major database of such type of protein classification.
Another types of protein classification is based on structural distance.
Today, I would like to focus on SCOP and CATH.

Slide 52.

This slide shows number of entries in SCOP and CATH.
In SCOP database, recent version defines 1086 fold.
The count of SCOP fold is increased as described here.
And also, number of CATH topology corresponds with fold is one thousand
one hundred and ten.
These counts of fold are almost same.
Please note that number of protein fold is limited and estimated as one
thousand one hundred.

Slide 53.

Next, I would like to talk about how to compare 3D structure.
Because comparison is very informative method anytime.
Many approach to compare the 3D structures are submitted.
Basic method of structure comparison is minimization of RMSD.
Alternative methods are listed but I would like to skip them today.
Application of structure comparison, for example,
It is utilized to classify3D structure domain as employed by SCOP and CATH.
Structural similarities can be used for functional annotation.
In molecular dynamics, structural change is calculated by RMSD.
Applying to discovery of superfold is also interesting.

Slide 54.

RMSD is "root mean square deviation".
Calculation of RMSD consists of three steps.
Firstly, generate sequence alignment to make residue-residue pair list.
And then translate and rotate the atomic coordinates to fit the target
structure.
Finally, calculate RMSD using coordinates of C-alpha or main chain atoms.
Formula to RMSD is described here.
Iterative process is applied to minimize the RMSD.
If RMSD is not decreased anymore, the calculation stops.
In general, 2 or 3 angstrom of RMSD is evidence of the structural
similarity.
However, please note that RMSD itself depends on protein size.
If protein size is larger, calculated RMSD is increased by accumulation
of the deviation of each atom.
Slide 55.

ProteinDBS is applied to detect similarity using RMSD.
You can submit PDB file as a query.
And result will be shown as below.
Top of one hundred structural neighbors in PDB are presented in the output

Slide 56.

Next, I would like to talk about protein structure prediction.
Protein structure prediction is basically predict 3D structure from
amino acid sequence.
That is grand challenge of bioinformatics.
Several types of prediction strategy are submitted.
They utilizes known protein structures, amino acid sequence and physical
properties of amino acid residues.
There are four method currently.
Homology modeling, 3D-1D (threading) method, Fragment assembly and ab
initio.

Slide 57.

The four methods are categorized into two groups.
Homology modeling and 3D-1D are template based prediction.
Fragment assembly and ab initio modeling are free from template of known
strcutre.

Template prediction method is first choice.
Template free type is in development phase yet.

So if you already find a template structure in PDB, please try homology
modeling.
If homologous structure is not found, you should try both of 3D-1D and
fragment assembly.
If the two results are almost same, the prediction may be confident.

Please note that realistic solution is only homology modeling.

Because method 3 sometime predicts new folding, the method is referred
to as "ab initio". However, to avoid confusing with 4, 3 is usually
called "de novo"or "New fold".

Slide 58.

This slide shows summary of homology modeling.
Homology modeling is based on simple concept.
"If sequence is similar, the structure is also similar."
This concept is considered as solid for almost of case.
If sequence identity of the alignment is more than 30 to 40%, this
method can be applied.
Enough coverage is also needed.
Result of prediction depends on the sequence alignment.
Prediction of side chain conformation is out of the strategy.
If there are too many gaps in the alignment, please be careful about the
prediction result.

Slide 59.

Representative web service of homology modeling is SWISS-MODEL hosted by
SBI.
User can submit amino acid sequence or alignment.
This service responds quickly. Computational time was 80 seconds for the
medium size of protein.
The prediction result includes side chain of amino acid. But it lacks
hydrogen atoms.

That is all for structure prediction.
Slide 60.

If you want to predict binding partner of a protein,
Knowledge based approach is helpful.
Database of protein-protein interaction, PPI is listed here.
Sequence search is available on the PPI databases.
Representative PPI database are BOND, DIP, MINT, HPRD and INTACT.
Integrated databases also provides PPI data.
You can predict binding partner from the result of sequence search.

If you know binding partner of your gene product, you can predict the
complex structure.

Slide 61.

It is very important for linking gene network and structural informatics.
Fundamental algorithm of complex prediction consists of five steps.
Modeling of protein shape and electrostatic map.
And then, sampling complex candidates from global search by protein
docking simiulation.
Next, protein complex candidates are evaluated by the program. For
example, binding free energy is applied to rank and filter out the
complex candidates.
Finally, refinement of predicted complex is performed.
That is basic schema of protein complex prediction.

Slide 62.
This slides shows details of complex prediction 1 and 2 is
pre-processing phase.
3 is most time-consumed step. So performance of this step is improved by
this type of program.

Slide 63.
Step 4 and 5 are post-processing of docking simulation.
Especially, assessment of step 4 is most important for the final result
of the prediction.
A lot of strategies are considered listed here.
Step 5 is molecular mechanics and molecular dynamics. Free energy can be
calculated in this step.

Slide 64.
This is an example of Web server for prediction of protein complex.
Please visit the web service if you interested in prediction of protein
complex.
This case is homo-dimer of super oxide dismutase one.
GRAMM-X could result in successful prediction.

That is all for complex structure prediction.

Slide 65.

Next I would like to mention disordered region in protein.
The disordered region is unstable protein structure more than 50 amino
acid long.
It is also known as natively unfolded region
The atomic coordinates of disordered region are missed in X-ray and NMR
structure determination.
And these sometimes become stable by binding with other protein.
CREB binding protein is a transcription factor and very long disordered
region is detected.

Slide 66.

Based on accumulated experimental data, challenge of prediction on
disordered regions is launched.
This approach of the prediction is collection of experimental data and
machine leaning for prediction.
Currently, it is known that about five hundred of proteins have the
unstructured motif.
Number of disordered region is more than one hundred.

Slide 67.
These are representative Web service for prediction of disordered regions.
DISOPRED and POODLE are winner of disordered region section of CASP contest.

Slide 68.
This slide shows summary of structural bioinformatics.

That is all for structural informatics.
Is there any question. Comments are also welcomed.

Okay, I will summarize them in Japanese.

Slide 69.

Finally, I would like to introduce a helpful philosophy called
"biological hierarchy".
"Biological hierarchy" consists of microscopic phase to macroscopic phase.
All of biological information is categorized into a phase of the
biological hierarchy.
So linking between different phases is discovery in the life science.

Slide 70.

This is the examples of discovery of inter phase linkage.
Disease depends on diet is linked between individual and environment phase.
For example, it is discovering the risk for stomach cancer and salty diet.
Disease triggered by conformation change in protein such as CJD.
This discovery linked individual and atomic phase.
As shown, the important discovery always linking different phases in
biological hierarchy.

Slide 71.
And I think there are two additional guides to biological hierarchy.
Evolution and polymorphism extended from individual phase.
Evolution includes comparative genomics, molecular evolution and
phylogenetic information and it can approach origin of life.
Polymorphism is keys to linking phenotype and other phase of biological
hierarchy.

Slide 72.
This is the final message from this lecture.
First step to discovery is
-all the information you have should be organized by the guide of
biological hierarchy.
-I wish you never be drowned biological information overflow by use of
the philosophy.

That's all for today's lecture.
I will take your questions.

Test メール 更新 Thunderbird

Thunderbirdから投稿テストです。

2009年9月8日火曜日

8月下旬~9月上旬ごろ 成長記録

娘の成長記録を、まとめて。

1) 8月下旬ごろ:娘がめでたく「エジソンのお箸」を卒業。普通のお箸に。
2) 9月上旬ごろ:娘に無断でクレヨンを持ち出したら、それは自分のと主張したいのか大泣き。その気持ちを察して代弁してあげたら落ち着いた。その時の一言。「ママのじゃないしー」。これ以降、語尾に「ないしー」を付けることが流行した。
3) 9月上旬ごろ:おむつがはずれるまで、もう少し、かな? 教えてくれたり、くれなかったたり、そのときによって様々。
4) 9月上旬ごろ:公文式の幼児向けドリルがブームに。ご褒美のシール欲しさに奮闘。いつまで続くか
5) 9月上旬ごろ: はしに続き、はさみの使い方がおおよそ完成した。手が器用です。
6) 9月上旬ごろ:地元のU音頭が大好きです。毎日のように踊っているそう。家内まで上手になっていて驚いた。
7) たまにですが、あかちゃんに戻ります。特に私が仕事に出る時に。

そろそろ幼稚園選びです。情報だけで2つくらいまでは絞れました。あとは見学の上。

来月10月18日に、誕生日から数えてちょうど1,000日だそうです。営業日計算で判明しました。
私は、約12,000日のようです。


近況報告

お盆休みから何も書いていませんので、このあたりで近況報告しておきます。いつものように、記憶をたぐりながらの執筆です。

1) 8/13: 予定どおり盆に帰省。娘を抱いてのフライトは乗務員のサポート手厚く着陸まで無事に。感謝。
2) 8/14: 齢96才の祖母と娘を会わせる。昨年の骨折で歩けなくなり野良仕事は辞めたようで肌の色がすいぶんと白くなっていた。2005年秋に家内と訪問した時は、小麦色で背筋もまっすぐ、畑に直立していた。あの姿が忘れられない。
3) 8/15: 姉家族とわたらせ河のプールへ。来年入学の甥っ子、英語の発音が上手になりました。fromとhomeの発音が同じだったけど、普通文脈で判断できるわな。おじさんも実はまだまだ勉強中、なのですよ。
4) 8/16: 自宅へ復路、飛行機で眠かったのか搭乗中から少しぐずぐず。見回せば周囲にもお子様たちがいて、やっぱりぐずぐず。連鎖反応か。そんな中、一人で乗っていた隣のお兄さん、紙コップの置き場に困った私にトレイを貸してくれた。感謝。それにしても69番ゲートは遠い!
5) 8/16: 娘が羽田空港のベンチで財布らしきものをひろった。私譲りの嗅覚か。もちろん届けた。
6) ひょっとして、姪っ子(3才)よりも娘の方が弱冠大きいのか?
7) 父母は元気そうで何より。特に母は以前の活力を取り戻した様子。
8) 帰省後、せっせとセミナーの準備を開始。作業行程すっかり頭から抜けたので、このブログに書いた先日のメモが役に立った。
9) 8/25 同僚の出産祝いを発送。
9) 8/27 2ヶ月ぶりのセミナー。60点。ある数値を入れ間違えるポカ。あせったが総括のスライドでかろうじて軌道修正できた。
9) 8/27 家内の誕生日。いちごのショートケーキ等でささやかにお祝い。ケーキは娘がぜんぶ食べました。家内はスポンジケーキが嫌いですしね。何よりも娘の幸せそうな笑顔、これが家内へのプレゼントなのでした。
10) 8/28 背筋痛で目覚める。しかたなく病院へ。筋肉の調整をしてもらいました。
11) 8/29 キャンプに向かう途中、衆院選の期日前投票へ。夕方にキャンプ場に到着。日の入り頃にサイト設置を完了。晩ご飯は近くのステーキ屋さんで。
12) 8/30 キャンプ場の近くの公園で一日遊ぶ。娘は遊園地、泥遊び、水遊び、ボート漕ぎでたいそうご満悦の様子。しかし、こんなところでトライアスロン大会(特に自転車)は危ないねぇ。
13) 8/30 興奮していた娘もようやく就寝。テントで寝ることには早くも慣れたようす。 衆院選の大勢が判明。家内と所感などを話しあった。
14) 8/31 キャンプサイト撤収。それにしても快適な、そして楽ちんなキャンプ場でした。すみずみまで行き届いており、反抗期2歳児&背筋痛の私というコンビにはぴったりでした。家内にはちょっと物足りなかったかな?帰りに、海の見える旅館で食事と温泉。絶景の露天風呂を娘と一緒に。娘にはお湯が熱かったよう。他のお客がいなかったし、湯温を下げてもらうようにお願いすれば良かったかな?
15) 8/31 帰りがけ、高速道路で家内とけんか。高速道路は家内の方が乗り慣れているので、私の運転では不安に感じるらしい。気持ちは分かるし、アドバイスをくれるのもありがたいけど、もうちょっとお手柔らかに頼むよ。
16)  最近聞いているのはRadioheadです。もうだいぶ前ことになりますが、Summer Sonicや幕張メッセの単独公演はすばらしい演奏でした。特にSummer Sonicの公演では突然のCreepに感極まった覚えがあります。その直前まで大物のblurが演っていたことは記憶に余りありません。かろうじてTenderが印象に残りました。コンサート、行っていないなぁ。


zenmanta test

2009年8月12日水曜日

メモ

研究対象の某がんマーカーの2量体モデル構築。休み明けの自分にメモ

ファイル名:「 05.B99990003cb05_07.pdb」Mod9v4でD600,K601を補完し2量体テンプレートPDBにsupuerimposeして2量体化した。
あとはマニュアル処理で各鎖のファイル上の位置の変更、アミノ酸番号の修正などを行った
1) ZN,Ca,Cl-のアミノ酸名、原子名を置換。スクリプト処理。2量体になっているので注意。
2) アミノ酸残基番号の変更は修正済みなので必要ない。
3) 糖鎖付加しているASNのアミノ酸番号を把握してNLNに置換しておく。
4) Leapで処理。まずはexplcit waterで。→エネルギー極小化。2量体化の結果一部の糖鎖とたんぱくが衝突しているので注意

こんなものかな。

近況報告

1) 2才半になった娘と初キャンプ。初日は好天に恵まれ、川辺で花火大会&お祭りで大興奮。なかなか寝付けず午後11時半にやっと就寝。その夜半から大雨。翌日も雨脚衰えず、文字通り止むを得ずに撤収。今年の天候は不順だ。また、晴れの日にいけたらいいね。
2) キャンプの翌日に詠んだ一句。「夏しぐれ 大風去って 蝉しぐれ」
3) 酒井法子事件は悉く不快なノイズでしかないので最早シャットアウトしたい。こんな時は、日本にやって来た外国人になったつもりで過ごすと良いかもね。「まー大騒ぎですなー。でも、日本の壱芸能人のことでしょ。興味ないねー。」という心境になりたい。私にとってはNHK大河ドラマ「利家とまつ」での好演が最後となりました。本人にとっては、20数年に渡り清純幻想を築き上げ、自らそれに引導を渡した。たった、それだけのこと。しかし、彼女の愛息はどうなるのだろうか。やっぱり、気になるなぁ。
4) Aのラストサマー、無事に終了したとのこと※。ぱちぱち。私は、家族とキャンプしてました。
5) 「おばあちゃんとおじいちゃんに会いたい」との娘のひと言により、夏期休暇を取って実家に帰ることになりました。娘と2人だけで、しかも飛行機でなんて、初めてだらけの帰郷となります。お父さんとの絆が深まれば良いね。ちなみに、体重を今日測定したところ、13.38kgでした。出生時から、おおよそプラス10kgです。フライトは明日。晴れるといいな。

※セットリストみたら、80年代の曲がほとんどでした。まるで「僕らの全盛期は80年代でした」と開き直ってしまったよう。聞き直してみると、90年代はもちろん、00年代に入っても名曲は出ている。汗涙以前の80年代はレコードの売り上げはあったけども、その後の音楽性、メッセージ性の深まりから、彼らにとってその時代は助走に過ぎなかったことが分かります。特に90年代に出た作品は圧巻の仕上がり、まさしく「円熟期」とと言えます。チケット取れなかった私のお仲間3000人が場外エリアに大挙したとのこと。このバンドの底力を感じます。集まった往年のファンのためにも、「星降る夜に」はぜひ演奏して欲しかった。私は全部で6回(1991,1992,1993,1994,1996,1998)参加できました。本当に、ありがとう。


某巨額グラント

某巨額グラント申請の結果が出たが落選のもよう。そもそも中心研究者として発ったボスは当初から現実を理解しており、採択される可能性は先ずないと考えていた。しかし、お上の勧めでやむを得ず申請し、私も一部協力するはめになった。驚くべきことは、今回の申請での協力者の一部に、一次審査は通るだろうと予想していた人たちいたことだ。彼らの予想の根拠は唯一、「お上の勧めがあったこと」だ。申請数を増やしておけば研究者の需要が大きいことになるから、巨額グラントの意義を国民に説明する場合の好材料となる。S特区の時と同じく、お上の意図はその程度の事だったのだ。「お上の勧め→優遇処置がある」という論理展開はあまりに前時代的で稚拙だ。Nature, ScienceやCellに1報は出ていないと一次審査すら難しいと悲観的(結果が出た今となっては「現実的」ということだったが)な私とは対象的であった。見通しが甘い人たちと今後も一緒に仕事していくのは難しいと感じた一方で、やはりボスは、見所があると思った。ボスがリタイヤするまでは出来ればこのプロジェクトにいたいと思う。

2009年7月25日土曜日

書評:内田 麻理香著 恋する天才科学者

 市立図書館の科学書コーナーで見つけました。控え目な背表紙が並ぶ中、ひときわ目立つポップ・アートな装丁に目が止まりました。タイトルは「恋する天才科学者」。ぱらぱらとめくると、歴史的な科学者たちの一般向け伝記のようでした。こうした伝記物は大好物ですし、このところ読書は専ら息抜きのためにしているようなものなので、さっそく借りて読んでみました。タイトルからも連想できるとおり、科学者たちの恋愛を中心としたウラ話満載の、興味深い良書でした。著者の女性的な筆はこびが印象にのこりました。この内田女史、時に「科学史ガール」、時に「単なるミーハー」に為り変わり、痛快に科学者たちの知らざれる過去を暴いて行きます。E.シュレーディンガーの章は衝撃的でちょっとひいたりしました。W.ハイゼンベルクの方が余程まともではありませんか。個人的な印象(思い込み)とは全く違うのがおもしろかったです。N.ボーアは期待通りの人物像でほっとしました。大学院生の頃だったと思いますが、ボーアの著書のあまりの難解さに己の頭の悪さを恨み愕然とした記憶がありますが、彼は説明が上手い人物ではなかったという事実(?)をこの本で知り、納得したような、安堵したような気持ちになりました。W.パウリが相対性理論の解説を残していたとは知りませんでした。排他原理の一発屋(失礼。これだけでもすごいことです)だと思っていたのですが印象が改まりました。日本人では南方熊楠が取り上げられていました。天皇陛下に献上した標本入りのキャラメル箱、彼の人物象の描写には欠かせない逸話です。R.ファインマン贔屓は研究業界には多いわけですが、著者の入れ込みようはまさに「恋する乙女」。「ファインマンさん」伝記シリーズから入ったのではなく、彼の教科書で惚れ込んだということですから、筋金入りのファインマン・ファンクラブ会員(!)ということでしょう。ニュートンやファラデー、アーベルといった近代科学者・数学者たちの章もあります。ガロアの章、結びの「1km離れて見ていたい」は思わずあははと笑いました。悲劇的なガロアの生涯は、どんな本でも鎮魂歌的になりがちですので、余計に可笑しかったです。参考文献も非常に良くできています。著者の徹底的な調べあげなくしては、ここまで楽しい本にはできなかったと思います。
 この書評は、読了後1週間で思い出しながら描いていますが、まだまだ書けそうです。好印象だったのは、科学者たちの権威失墜を狙ったものではなく、彼らへの愛に満ちあふれていることです。書き方でよく分かります。敢えて難点を上げるとすると、宇宙人V.ノイマンは外せなかったかなと思います。よって、続編を希望します。


2009年7月24日金曜日

近況

1) 先週の3連休は申請作業のため2日間仕事した。明日も仕事。
2) 梅雨が明けても良いころなのに、天気がすぐれません。明日も雨らしい。
3) 職場でとうとう諍いが。挑発にはのらないように気をつけて欲しいものだが、残念。忙しい時は、コーラは控えた方が良い。眠い時でもカフェオレがちょうど良い。
4) 先週の土曜日に、娘とプールに行きました。浮き輪をひっぱってあげると喜ぶ。そのうち自分で引っ張るといいだした。自分が浮き輪の中にいちゃ、ひっぱっても進まないでしょ。



2009年7月17日金曜日

近況報告

1)娘は久し振りに一時保育。今日は終日雨のようだけど、お部屋の中で過ごせるかな。昼寝はちゃんとしてくれないとね。送る途中で朝の渋滞にまきこまれたそう。お疲れ様。
2)娘のおむつはずしスタート。来春の社会参加(幼稚園入学)に備えるのです。おむつとパンツ、両者の長所短所を理解しているのか、パンツを勧めてもしばらく迷ったような素振りを見せます。
3)「すっく」で「まいにちの靴 キャンパス」をリピート購入。16cmは大きかったかな。でも小さいサイズを買うとすぐに買い替えになるし。。娘はとても気に入ったよう。靴を勝手に下駄箱にしまい、一時行方不明になった。家内と探していると、「ここよ、ここ」と自分で下駄箱から出してきた。
4) 職場の緊張感。私にも原因が?良い結果に向かうことを祈る。
5) 先日の書評「されど我らが日々」を振り返った。私は著者の文章力に嫉妬しているのだろう。ここに白状しておく。

このブログでは「近況報告」=「最近のこと」。適当です。


2009年7月15日水曜日

最近のこと

1)また窓を開け放しにして外出してしまったらしい。幸い何も盗られなかったようだが、家内はもちろん*かんかん*なわけで。そりゃ怒られるのも当然なわけで。ひたすら反省。我ながら間抜けですなぁ。静かだと考え事をしてしまうらしい。玄関のドアに覚え書きを書こう。そして盗人退治のため巧妙なワナをしかけよう。

2) ある人の欠点ばかり見ていると、その人との関係が悪化していくので、良いところも見よう。それでも許せないなら、距離を置いてみよう。そんな話を家内にしてみた。

3)Debussyが予想以上に良いです。Straussはまあまあです。美しき青きドナウはTVCMや街頭の音楽などで食傷気味だけど聞き込んでみると心地よい


2009年7月12日日曜日

Aについて

チケット取れなかった記念としてAについて少し書きます。

 Aのアルバムを初めて買ったのは中2の秋(1990年)でした。ご多聞に漏れず中2病にしっかりと罹患していた私は、自由とは何か、自分とは何者か、自分はどう生きるべきなのか、あれこれ考えては悶絶していた。いくら考えても答えが出ない。良くある話だが、特に自由への渇望は他の人よりも強かったに違いない。
 
 私は、小さな工場を経営する父の跡継ぎとして生まれた。しかし、この工場を継ぐ気が全く起こらなかったのである。そんな私に、親や親戚はどうにかして私に継がせようと、集まるたびに説得しにかかるのだ。「職業って自由に選択して良いんじゃないの?」。たしかに原則はそうだろう。しかし、父母が一生懸命、必死の思いでに工場を経営している姿を皆知っていて、私は私で自分がどれほど必要とされていることが分っているから、余計に辛かった。多くの同級生がBやXを選ぶなかAを聞いていた理由は、反逆でなく自由を求めていたからに違いない。Aは自由の獲得とそれを実現するための自己変革、そして自由に伴う責任を、歌にして私に届けてくれた。すがるような気持ちで彼らの曲を聞いたものである。初めてのライブは高校1年。石油会社の横浜の空き地で行われた夏の野外コンサートだった※1。同じ夏に日本を代表するバンドSのコンサートにも行っているが、Aのパフォーマンスが圧倒的で印象強く、このバンドでしか味わえない強烈な魅力の虜になった。めでたく(?)A中毒となった私だが、相変わらず自分が何者であるかの答えは出せず、とりあえず部活動に精を出した。高2の頃から友人を誘ってAのライブに連れて行ったりした※2。その年は、夏のイベントが部活動の夏合宿に最終日にあたっていた。3日間にわたる厳しい合宿※3 の解散の後、くたくたの身を引きずるようにして横須賀まで電車を乗り継ぎ、開演と同時に会場にすべり込んだのは壮快な思い出。それまで「欲がない」と言われていた自分が初めて何事かを達成した瞬間だったと思う。この頃から、何事も前向きに考えられるようになった。自分探しにも一応の蹴りがついた。自分の人生は、自分で切り開くしかない、という覚悟を決めたのである。TTが伝えるメッセージと、この時の達成感が意図せず歯車のように上手くかみ合った。それがなければ今の自分は無かったと思う。

 大学生になると、メンバーのSKのラジオの影響から洋楽を聞き始めた。大学院に入ると、洋楽一辺倒になり、ほとんどAを聞かなくなった。あれほど熱望していた自由が与えられたからだろう。博士研究員になると、「え、アルバムでてたの」という完全な卒業状態に。今再びA熱が上がっているのは、家庭での役割が増え、自由が無くなったからだろうと自己分析しているが、どうだろう。私にとってAは、自由の象徴なのかもしれない。「この人生は誰のものでもない」。でも、私の場合は半分以上は愛娘に捧げることになるだろう。私の両親もそうしていたのだろうから、それで良いと思っている。

 Aについては、また気が向いたら書きます。

※1 帰途、あまりの混雑で最終電車に乗り遅れ、やっとの思いで大宮駅についた。駅で一夜過ごそうと思って電話すると父母が1時間もかけて迎えに来てくれた。こういう親だったからこそ、継がないという決意に罪悪感は強く、悩みは深かった。

※2 皆それなりに楽しんでくれたようだが、その後A中毒になる人は一人としていなかった。。

※3 弓道部だった。尋常でない程に弓を引かされた。25立ち/日くらいだったと思う。




2009年7月11日土曜日

書評:柴田翔 されど我らが日々

往年のベストセラー。私が尊敬する某アーティストが多感なころ(高校時代?)に「二十歳の原点」とともに読んでいた作品として挙げていた。たまたま古本屋で見つけたので買って読んだ。作者の鮮烈な表現力の虜になり、時に思わず感極まった。しかし落ち着いてストーリーを反芻してみると、疑問な点が多いことに気が付く。

 自死を選んだ女学生の手紙(症状、心境などを描写している)は、どのようにして主人公に郵送されたのだろう。睡眠薬をoverdoseして意識が朦朧としているはずの人間が、ポストに投函できるとは考えにくい。遺書として葬式で受け取るとか、もっと自然なプロットがあったろうに※1。あと、女性の心理描写について。実際の女性はそんなものでなはいと思うけどなぁ、と思う場面が多々あった。いくら幸せな家庭像といっても、きゅうりをせっせと洗う自分に思いをはせるかねぇ。料理が得意な女性でも「きゅうり洗うのなんて手が荒れるしメンドクセェ」と思っているはずで。作者の筆力に引き込まれぐいぐいと読み進んでしまうのですが、突如こういった冷水を浴びせくるわけです。「所詮はフィクションだ」と気が付き我にかえる。その度にとても残念な気持ちにさせられる。そして、結末。この作品が書かれた当時、女性の自立には大変な覚悟が必要な時代であった。その時代は衝撃的であったであろう結末も、現代ならむしろ自然な展開となり、小ぢんまりと終わってしまった。そもそも従兄妹どうしが親戚に勧められて婚約するのにも無理がある。インテリ家系なのに遺伝学の初歩もしらんのだろうか。

 ただ、この作品、作者若干25才という若さで書き上げたことには驚嘆する。重厚で流麗な語彙、尋常でない心象表現力。詩的感性の強い作品が好きなら、おすすめ。ベストセラーになったのは時代背景の効果が大きいと感じるので、当時の若者の考え方や暮らしについて興味のある人にも※2。

 思わず辛口になってしまったのは、某アーティストの影響や名作としての期待が大きかったからだろうか。個人的には併載の短編、「ロクタル管の話」の方が数段面白かった。

※1 文芸春秋の文庫版に解説があるそうだが、作中でなんとかすればいいのに、と思うのは厳しいかな。
※2 この作品のように、学生が左翼的運動や目的不明の合宿に明け暮れているようでは、親御さんによっては大学なんて行かせたくなくなるだろうな。。こういったベストセラーで大学や大学生のイメージを貶めるのは、もう勘弁してほしいと思う。少なくとも、多くの理系の大学生は、真面目で毎日一生懸命です。




2009年7月10日金曜日

報告&雑感

1) この週末、家内と娘は親戚の家に遊びに行きます。仕事を進めたい。明日は大学で仕事したいなぁ。←大雨で速攻くじけるに1票。
2) 自転車のカゴを取り替えなきゃ。穴から水筒が何度か落下してヒョエー
3) 高速シーケンサーの値段っていくらくらいなのか。維持費は良く聞くけれど。
4) CNETでGRAPEに対する批判記事を見てショックを受けた。院生の頃MDGRAPE使ってたなぁ。その計算速度には感動したものです。
5) GPGPU対応のドッキングシミュレーションソフトって公開されていないのかな

Twitterとのすみ分けが分らん。。

2009年7月9日木曜日

Moodle, 透過PNG, faviconとか

 プロジェクトでファイル共有インフラ構築・管理の仕事をしています。これまでGoogleグループを使っていたけれど、使い勝手に不満がでてきたし、機密にあたる書類を外部サーバに置くのもなんだかなぁ、ということで、私が手をあげてやっています。

 新しいサービスはMoodle。このファイル管理機能を使って、皆でファイル共有をしようというもくろみです。すでに外部研究者との資料のやりとりで稼働実績があるので特段の懸念はない。実際、オープンしてみたけどトラブルもなく順調な滑り出し。しかし程なく登録キーを非関係者にまで送ってしまったことを指摘される。。私ってば本当ザンネンな奴です。

 Moodleを採用したのは、アップロードしたファイルにウィルススキャン(clamav)をかけてくれるからです。これでサーバもクライアントPCもいちおう安全です。研究用サーバにホストさせているのですが、こいつがウィルスを配布して当局に取り上げられてしまったらと思うとぞっとします。ウィルススキャンは完璧ではないと思うけど、ないよりは余程まし。

 さて、トップページにプロジェクトのロゴマークでも入れましょうか、という気になったので、Mooldleのソースを眺める。以外と簡単に張り付けられることが分かった。しかし透過PNGでなくと格好悪いので、さっそくJTrimで透過PNGを作成する。サーバにあげてソース(といってもhtml)書きかえ。問題なく表示された。

 faviconもロゴマークベースのものに差し替えた。ロゴマークの中央部をJTrimで切り出して、透過処理せず(しても大丈夫と思う)にPNGで保存。最後にWebサービス「Faviconメーカー」(http://favicon.webmeister-jp.com/)でアイコン化。Windowsのフォルダに入れて、「表示→アイコン」でアイコンとして認識されるか確認。サーバにあげる。めでたくFireFox, Google Chrome, Lunascapeでアドレスバー、ブックマークリストでの表示を確認。IE6は表示されなかった。IE6のfavicon仕様は厳格らしい?IE8なら表示するらしいが未確認。

 JTrimいいね。作者に感謝です。今年の年賀状向け画像の処理にも使わせていただきました。

JTrim
http://www.forest.impress.co.jp/lib/pic/piccam/picedit/jtrim.html




2009年7月8日水曜日

ノートPCでも買おうか(1)

条件:トラックポイントで画面がそこそこ大きい。
メインマシンとして使用可能なスペック(ハイビジョンの動画をDVDに焼きたい)。WIndows XP Down grade付。
予算は18万円。できれば予備バッテリ・ACアダプタ付き。MS Officeは前に買ってあるから、無しでOK。

1)DELL Latitude E4300 (13'')
2)Lenovo Thinkpad X200 (12'')
3)Lenovo Thinkpad T400s (14'')
4)NEC VersaPro UltraLight タイプ VS  (10.6")

SONY type Pは一時期ハマっていたシグマリオンによく似ている。惹かれたがやはりメインとしての機能はないので除外。

T400sの発売後だがX200の価格は下がらないようだ。。

LatitudeONっていつ実装されるのかね。これでPomera感覚でテキスト打ちができれば良いね。
ThinkPadは2台持っています。IBM時代の代物で、1台は380XDという分厚い機種でした。当時のお気に入りでDebian入れて良く遊んでいました。Lenovoになってからは、買っていない。。T400sは1.9Kg。モバイルできるのかな?保有機種のACアダプタは使えるだろうか。。
NECのはネットブックだから、別にメインマシンないとちょっと厳しいかな。

Windows 7発売まで待とうかな。日本では10月22日発売とのこと。アップグレードキャンペーンが始まっているらしい。

ちなみに、今の機種は、DELL Latitude D420です。かれこれ3年使っている。最近は起動が遅くなったけど、おおむね快調です。

あと、Aの最後の夏イベ、あえなくチケット外れました。ということで、1998年の昭和記念公園が見納めでした。
あの夜の「幻想」は忘れられない演奏です。もう10年以上行っていないのか。早いものだ。一般発売ですか? はたして望みはあるだろうか??

実を言うと、2000年頃からフジロッカーになってしまった。。スミマセン

野外コンサートの素晴らしさを教えてくれたのはAであることは、確か。


2009年7月7日火曜日

成長記録2009年7月ごろ

1)ごはんとおかずを同時に食べることを覚えたようだ。
2)DVD崖の上のポニョを飽きずに鑑賞。おおよそ100分のアニメ映画。彩色の美しさを感じて欲しい
3)しまじろうの幼児向け英語教材を買ってあげた。メロディー★スターに、「これ、おもしろい!」連発もなぜかパパに殴りかかる。イテ-ヨー
4)自転車を買ってあげた。うどん屋さんから公園内に駐車した自動車まで1時間半かけて必死に運転。最後まであきらめなかった。えらい!ちなみに、自転車の車種は、

http://www.bscycle.co.jp/root/catalog/hacchi/index.html

防犯登録込で、2万2千円くらいで買った。お気に入りだ。

5)くもん教材「ひらがなサイコロ」買った。「は」と「な」が偶然揃ったので、これで「はな」ちゃん、だよ。と教えてあげると目を丸くして感心してた。

寝かしつけの間に咳をするのが心配。空調のせいかな。




2009年7月3日金曜日

お台場から戻りました。

1)辞めていく人の代理でバイオEXPO。この人と会場で会うも怨恨系ネガティブトークにうんざり。もう聞かなくて良いと思うとほっとする。

2)なつかしの研究所で元同僚のSRさん、TJさんと面会。等身大ガンダム見るの忘れて午後7時20分まで話し込んだ。YCさんとMAさん、それとTMさんには展示会場で会えました。新人のHさん、Iさんともご挨拶。若者の参入は嬉しいこと。リーダーのI先生は出張で不在。MKさんもいない。残念。I先生は多くの若者の手本になる人です。新人さんにはI先生の持つ美意識のようなものを是非学んで欲しい※

3) のぞみの終電で帰りました。自宅への帰途、ピンクのポーチを拾った。中をみると20枚近い診察券などが入ってた。今朝交番に届けた。落とし主のひと、見つかるといいね

※私はI先生の薫陶を受けたにもかかわらず未だに泥臭雑草タイプです。。


2009年7月2日木曜日

2才の娘に人を叩いてはいけないことを理解させるロジック

 娘(2才5ヶ月)が人、しかも自分よりも小さい子を叩いたり、突き飛ばしたりするようになりました。最近は、家内や私にも。その場で注意するようにしているのですが、反抗期とは言え、困ったものだ。私も家内も手を上げたりすることはないので、どうやらお友達の攻撃を受けたことが原因のよう。お正月にいとこのYちゃん(そろそろ3才)に、しょっちゅう突き飛ばされていたからなぁ。前月の会ったけど、その時はやり返すようになっていた。本人はすっきりしたことでしょう。しかし、だからといって人を叩くことはいけない事なのです。
 「やられたらやりかえす」という短絡的思考は、一見して合理性があるので、嵌るとなかなか抜け出せない危険極まりない考え方です。そのような考え方を改めることができなければ、いずれ信頼を失い、友を失うことでしょう。そこで、娘を説得するロジックを考えました。
 
1) よそのお友達に叩かれて、痛い、くやしい思いをしたのだね。辛かったね。と、まず同情する。
2) でも、叩いてはいけないの、だって、叩かれたら、とても痛いでしょう? と叩かれた人の気持ちになってもらう。
3) 叩いてくるお友達はいるけれど、みんながみんな、叩いてくるわけではないでしょう? と問題は限定的であることを示す。
4) 叩いてこないお友達や、あかちゃんまで叩かなくてもいいでしょう? かわいそうでしょう? と否があることを示す。
5) ママだって同じだよ。ママが叩いてくるの?叩かないでしょう。だから、ママも叩いちゃだめ。 と同じ論理の適用範囲を拡大。
6) あなたは本当は、やさしい子だということを、パパは知っている。だから、叩いたりしちゃ、だめよ。

 昨夜は1)→2)→6)という展開で説得。納得したらしく、おとなしく寝支度に入った。特に1)と6)で心が通じ合ったような気がした。それ以外は2才児には難しいかな。

 手荒なことをするお子さんがいなくなるのが一番なのですけどね。下の子ができたりすると、ストレスがたまって、暴力をふるうようになるらしい。ふるわれた子のほうにも暴力が伝播して、娘のような一人っ子にも被害が。。というわけでしょうか。でも、僕も姉にいじめられたけど、僕自身は年下の子を叩いたりしなかったなぁ。うーん。







近くのうどん屋さんで

私の家の近くに、ざるうどんがとてもおいしいお店があります。暑くなってくると、このうどん屋さんに寄りたくなります。このところは、毎週のように通っています。ある日、娘にうどんを食べさせ、ひと息ついて、さあ出るぞ、というところに、年配の女性が現れ、食器を片づけるのを手伝ってくれました。この方は、隣の座席の人で、ことあるごとに娘が愛嬌をふりまいていた(うどんをくわえたまま、「にまぁー」と笑う等)のです。だからといっても、そうそうできる申し出ではありません。親切な女性にお礼を行って、退店しました。私があまりに必死だったからかな?

久し振りのお台場

1) 今日は、展示会の仕事でお台場に来ています。前の職場に近く、よく通った場所です。なんと偶然にも元同僚が隣の隣ではないですか。昨年冬の学会以来なので、半年ぶりということになります。私と同じ大学の人含め、この辺り一帯、まだ誰も来ていません。展示物の搬入もまだのようです。せっかく早めに来たのになぁ。雨に降られなかったから、よかったとするかぁ(12:34)。
 2) ZEPP東京でライブはあるのかぁ?あるなら見に行きたいなぁ。。人も展示物もまだきません。午後3時までに霞ヶ関に移動しなくてはいけない(13:18)
3) 等身大ガンダムって、どこから見えるのかぁ。(13:22)


2009年6月27日土曜日

近況報告

最近更新していなかったのは、毎月末のセミナーの準備があったからです。
1週間あたりのこと。

1) 6/23: 娘が2才5ケ月に。「パパ、ギザギザ(←肌のこと)、かわいそーねー。」 うどん何食べたい?と聞くと「ぶっかけ」と答えるらしい。あと英語に興味があるようだ。
2) 6/23: 大学構内で1,000円札拾った。拾得届書いて総務課総務係に提出した。世の中は誘惑が多いです。「隙あらば業を負う」
3) 6/25: セミナー。誤解をおそれず、堂々と結果を報告。でも、誤解されるのは、イクナイ。
4) 娘に自転車かってあげたい。やっぱりメーカー製の方が安心かな。子供のころ、自転車乗ってて車にはねられたことがあるので。ヒャー
5) 盲目のピアニスト、辻井伸明さん、国際コンクールで優勝とか。すばらしい。私も先天性の機能障害を持つ身。応援したい。
6) カウンター設置したが、予想どおり誰も見ていないことが判明した。
7) Twitter始めようかな。Bloggerで表示する方法を教えてほしい。
8) 足利事件では鑑定結果が一人歩きしてしまったようだ。研究者は結果の信頼性をきちんと説明したのか?典型的な情報ミスリードによるトラブル。科警研の責任は重大。



2009年6月20日土曜日

ニ十歳の原点

お母様の高野アイさんの記事が出ていました。今月24日に40周忌とのこと。

http://www.asahi.com/jinmyakuki/TKY200906190229.html

書評は書けたらかけます。すごく疲れそう。

2009年6月19日金曜日

ラフマニノフ

500円CDならあるらしい。Amazonで発見。


1周年

ブログ再開1周年の記念として、タイトルとスキンを変更しました。ニュースリールとアクセスカウンタも設置。ちゃんと動くかな。1年でたった35件の投稿って、、少ないなぁ。向いて無いんだなぁ、きっと。

2009年6月17日水曜日

FoxTab

FireFox3.0用のAdd-on。これは素晴らしい!!かっこいいね。用途としてはタブカタログと同じです。表示機能はモダンなFoxTabに軍配か。

FoxTab
https://addons.mozilla.org/ja/firefox/addon/8879

タブカタログ
https://addons.mozilla.org/ja/firefox/addon/1937


2009年6月13日土曜日

考えたこと 090613

1) ラフマニノフの350円CDってないのかな。
2) フロリダの研究者がやっているMathematical Oncologyが気になる。NatureとCancer Researchに記事
3) A最後の夏のイベント、参加できるか検討中。家内からは桶もらった。ありがとう!!感謝します!!!あとは仕事と調整か。
4) 第32回日本分子生物学会年会の抄録投稿の締切日が公開された。8月3日(月)~28日(金)とのこと。昨年より1ヶ月遅い。ほっとした。


青春の息吹に

今日は近所の高校で演劇「ももたろう劇場」を観にいってきました。期待以上の出来で、とても素晴らしかったです。娘も大喜びでした。ブラックファンタジーは私にとっても初体験で、あまりの幻想性に我を忘れ思わず見とれてしまいました。ピノキオの声をしていた人はセミプロ級ですね。本当に高校生ですか。帰りの運動公園では、県大会かなにかでしょうか、中高生が集結していました。今日はさわやかに青春の息吹を感じることができました。自分もあの頃があったことを思い出しました。向こう知らずを承知で好きなことに体当たりできる、あの頃の経験はとても貴重だと思います。娘にも目覚めの季節が来るのでしょう。まだ2才ですが、いつの日か、そうなるのでしょう。


読んだ本

専門書以外。昨年の夏からこの春まで。少ないなぁ。

博士の愛した数式 小川洋子
祖国とは国語 藤原正彦
されど我らが日々・ロクタル管の話 柴田翔
ニ十歳の原点 高野悦子
人生に関する72章 藤原正彦
NHKスペシャル 100年の難問はなぜ解けたか 春日真人
のぼうの城 和田竜
地獄の日本兵 飯田進
天才の栄光と挫折 藤原正彦
アーロン収容所 会田雄次
論文捏造 村松秀

※書評を書いてから投稿しようと思っていたが、書けずにそのままにしておいた。
本のタイトルだけでもここに記録しておくことにしました







さてさて、近況報告

近況報告です。

1) 娘が保育園に一時預かり、2回目。近くの植物園までみんなと散歩したそうな。家内と別れる時も泣かなかったらしい。立派
2) 理由はよくわからないが、契約1年追加してもらったらしい。引っ越ししなくてすんだ。能力が認められていると信じたい
3) 本は、太田朋子氏の「分子進化のほぼ中立説」。ブルーバックス久し振りに買った
4) CDは、クラシック・ピアノとThe A。10年ぶりにAlfee熱復活か?クラシックは月並みだろうがショパン。洋楽はもうわからん

※娘の体重は確か、12.78Kgだったと記憶している。先日測定した。
※聞いている曲はAの「ONE」と「Going my way」。大切なことを思い出した。TT氏に感謝。





2009年5月25日月曜日

Scribefireからテストです。

Scribefireから書き込みテストです。更新頻度があがればいいな。

2009年3月20日金曜日

マイバースディ

 今年で早33才です。生命の誕生、その直後から始まった新陳代謝により、私の体は原子をずっと入れ替え続けているわけです。33年間を通して私の体に定着している原子は、いったいいくつのなのでしょう。たとえ100%入れ替わっていたとしても、私は私で、記憶だってそのまま(?)です。不思議なものです。33才になっても、こんな他愛のない夢想をしています。おっちょこちょいも相変わらずですしね。一方で、家内はここ2年で本当にしっかりしてきました。成長ぶりに脱帽です。すでに尊敬の域に達しています。

 昨日は母の誕生日でした。おめでとうございます。直接本人には言えませんでしたが、感謝しておりますよ、母上。

 私の部署は、来年からは大幅に人員削減の模様。その余波で私もウェイトの高い雑用を担当することになります。おそらく多くの人と衝突し、お互いに消耗することになるでしょう。この用事が本格化するまでは、研究に専念することにします。

 娘は成長はありがたいことに順調です。言葉をたくさん覚えました。数え切れません。昨夜の本の読み聞かせでは、「しましま」を覚えました。「しまうま」と「うま」の区別が着いていないことが発覚したので、しまじろうの頭やしっぽで「しま」模様を説明し、「シマウマ」は、 「しましま模様の馬」と説明したら、納得したようす。シマウマと普通の(シマウマでない)馬の区別が着いたようです。素晴らしい。

2009年2月3日火曜日

職場の雰囲気

職場の雰囲気、くら~い。仕方ないですね。プロジェクト不採択だったのだもの。私は、職場では不思議なくらいマイペースです。一方、家庭を顧みれば、先日2才になった娘の幼稚園のことが気がかり。来年の今頃はどんな状態なのでしょうかね。