テキスト書きのためのバージョン管理

単に git を使うだけではけっこう厳しい。

まず、テキストメディアは、テキストデータそれ自体は論理情報だが、表現は視覚情報と不可分であることも少なからずある。ただし脚本やボイスドラマのようなものは必ずしもそうではなくて、これらはある種のソースコード、たとえば楽譜のようなものとして扱うことができるかもしれない。それはひとまずおいておく。

ここでは視覚テキストメディアの話をしていく。視覚テキストメディアとは、

  • 字幕スーパー
    • 1〜2行、十数文字程度
  • ゲームの会話文
    • 一つのメッセージウインドウに2〜4行程度のメッセージが収まる
  • Twitter小説
    • 1メッセージ140字程度
  • 紙の小説
    • 一ページに一行40字程度、20行くらいの文章が収まる
  • Web 小説
    • 一行40字程度で数十〜百行以上連続する
    • PCとスマートフォンとで一行の表示文字数に違いがあることもある
  • 電子書籍(フローレイアウトの場合)
    • 一行、一ページの表示文字数は可変で不定

のようなものである。もちろんゲーム実況動画*1など、より複雑なケースもあるだろう。

Web小説や電子書籍のフローレイアウトのような一行の文字数が可変になりうるメディアにおいては、形式段落程度の粒度で差分を取り扱ってもそれほど不自由はない。場合によっては句点など文の終了記号単位で分割してもいい。ただし、そうであっても生のテキストデータのままで差分を作るのは難しい。一行が百文字以上になることは少なからずあり、同じ行内に複数の変更が混在しうる。そしてそれら変更にはなんら相互関連性がないこともしばしばある。コミットの粒度をちいさくすることで差分を取り扱いやすくしようという git の思想とは相容れない部分である。

どうするか。たとえばもっと小さな単位で分解して構文木を作るというやり方がある。構文木は論理情報なので差分を出すのに向いている。
現実的で低コストなのは、ある種の約物で分割してしまうというやり方である。句読点や括弧類をまたいで相互に影響するような変更というのがまったくないわけではないが、それはプログラムのソースコードにしてもそうである。関連する変更がバラバラになっても、一行に複数の変更が混在するケースを減らすほうがマシだということである。小説は作業工程の都合上、コミットの粒度をちいさくするのがむずかしい。だから変更点を細かな単位で抽出しましょうということである。欠点もある。句点の位置が変わることはあまりないが、読点の位置は変わる。約物の単位で作った構文木同士の差分では、おそらく読点の位置を変更しただけの変更がそうであるとわかりにくくなる。

文字数が可変な媒体はそれでいいとして、一行の文字数なり一ページの行数なりが固定のレイアウトにおいては、折返し位置が重要な意味を持ちうる。おおよそ編集時には自動折返しを利用し、出力時に固定位置で行分割を行うと思う。行分割後のテキストデータは編集性が著しく下がるからだ。しかし、差分としては出力時の状態で出したい。

この場合、一文字挿抜するだけで全体の見た目に影響を及ぼすことがありえる。git は単にある行の何文字目の文字が増減したことしか関知しない。差分の論理情報としては正しいが、チェックを行うにあたっては、出力結果の差分を取り扱う必要があり、それは画像の差分と同じようなものとして考えなければならない。たとえばバイナリエディタの差分機能のように位置の取り扱いが厳密に行われるものがあるが、視覚テキストメディアのソースコードもまたそのように扱うべき性質のものである。

視覚に関しては、たとえば禁則のようなルール以外に、複数行間での行頭あるいは行末の文字の重複のような見栄え上の問題もある。これをチェックするために差分を出したいわけだが、別段人間の目で検出しなくてもよく、機械的に処理可能ならそのようにすればよい。であるなら、視覚上の差分の検出にそこまでこだわる必要はなくなるかもしれない。

プリコミットフックなどで自動で構文木を作って git で管理するようにすれば、まあまあマシになるのではないかと思う。あくまでマシであって、作業プロセスにバージョン管理ツールを組み込みにくいこと自体をどうやって克服していくのかという課題は残る。どうするのがいいのかアイデアがあったら聞きたい。

こちらからは以上です。

*1:たとえばbiim式実況動画は字幕と右枠説明欄とでそれぞれに独立してテキスト表示が進行する

Weblio のプレミアム会員が便利

Weblio という辞書サービスがあるんですが、これをオンラインの英語辞典として使っています。月額300円払うとプレミアム会員になれるんですが、プレミアム会員になると辞書のカスタマイズができ、おおよそこの機能のためだけにプレミアム会員になっていました。

辞書のカスタマイズっていうのは、使わない辞書を非表示にするやつです。

ぼくは、

  • 眼科専門用語辞書
  • PDQ®がん用語辞書 英語版
  • ライフサイエンス辞書
  • 遺伝子名称シソーラス

この4つを非表示にしています。

まあたかだかこの程度のために300円払うかどうかは人によるとは思うんですが、広告を非表示にできたり、単語帳に20000語まで登録できたり*1、という具合に便利な機能もあるし、なによりオンラインの辞書サービスには存続してもらわないと困るという気持ちもあり、使わせてもらってありがとう料みたいなところもあります。

で、最近気付いたのが、どうやらWeblioには語彙力診断テストとかいうものが存在するらしい。無料でも使えるんですが、プレミアム会員は制限なしで使うことができます。

英検の各級やTOEICの各スコアに応じた語彙をどれくらいカバーできているのかみたいな診断もできる。え、便利じゃない……?
私は英検は2級を受けるのが面倒になって準2級までしか持ってないし、TOEICも受けるのが面倒になって受けにいってなかったんですけど、じゃあ自分が果たして今どれくらいのスコア取れるんだろうみたいなの実はあんまりよくわかってなくて、携帯に Duolingo とか入れて英語勉強するかーってときも、どれくらいの難易度からはじめりゃいいんだっけ?みたいなのがわからない。

ちょっと試しに470やったら全然かんたんだったので、600と730に挑戦したら、600はまあいけるけど730はカバー率50%という感じになったので、おおよそ600〜700点台という感じらしい。総合力診断ではだいたい語彙数6000くらいと出たので、妥当な線でしょうという感じもする*2

まあこういうサービスいろいろあると思うんですが、月額300円で辞書を快適に使えて語彙力診断できてわからなかった単語を単語帳に放り込めるみたいなのが便利なので、英語やっていきたい人はおさえておくといいかもしれません。これプラススマートフォンアプリっていうのがいいかもしれません。スマートフォンアプリのほうがたぶんスピーキングとリスニングには向いてるし。

こちらからは以上です。

*1:実用レベルだとせいぜい2〜3000語登録できれば充分な気もします

*2:700点台は8000語必要らしい

私を構成する5つのマンガ

っていうのがツイッターでちょっと流行っていて、まあやったんですけど、5つに絞れねーじゃん!ってなって、でも振り返って自身についての影響を考えてみると、まあやっぱりこの5つなんじゃないか、という感じになったので、5つについてちょっと掘ったものを書いておきます。

王ドロボウJING

続編も込みで好きなので続編の方も。

エピソード連作方式で、各エピソードに一人ずつジンガールというヒロインがいるというふうになっています。ボンドガールみたいな。キャラクター名がお酒をモチーフにしていてこのへんからお酒に興味を持ったと思います。シャルトリューズとかいうお酒のことを知ったのもたぶんこの作品だったと思う。絵がまずすさまじいので絵の話になることが多いんですけど個人的には台詞回しが気に入っています。あとは話の読後感のよさがまた絶妙にいい。毎回ヒロインが変わるということは、毎回出会うところからやって最終的にヒロインとの別れを描くので、そういう感じになります。伝わってくれ、いや伝わらないので読んでくれ。

競馬狂走伝ありゃ馬こりゃ馬

ありゃ馬こりゃ馬 第1巻

ありゃ馬こりゃ馬 第1巻

ありゃ馬こりゃ馬 第5巻

ありゃ馬こりゃ馬 第5巻

最近馬の話ばっかりしてて馬好きなんだろうなっていうのは伝わってると思うんですが、ぼくが馬をいちばん見てた時期が98~99年くらいで、当時はサイレンススズカステイゴールドグラスワンダースペシャルウィークエルコンドルパサーセイウンスカイ……とそうそうたる顔ぶれだった時代なんですけど、だいたいそれくらいの時期に完結したマンガです。
リンクは1巻と5巻のものなんですけど、これ見てわかるように1巻~4巻までと5巻とで作風がぜんぜん違うんですよね。4巻まではギャグ、競馬あるあるマンガという感じで、5巻から打って変わって競馬ドラマになっていきます。田原元騎手の競馬観や騎手観が投影されていて、そのあたりのリアルさやシビアさは真に迫るところがあります。原作の田原氏自らが体験したサンエイサンキュー事件を元にしたエピソードとか。最終巻がこれまで凄まじい。読んで味わってほしい。全17巻と割と手を出しやすい長さだと思います。

天からトルテ!

週間ファミ通で連載されてたファミ通編集部に魔女がやってきてドタバタ騒ぎを繰り広げるコメディマンガです。マカロンとかいうメカクレ魔女が出てくるんですけどメカクレに目覚めたのがたぶんこのへんからだと思います。グラニテとトルテもかわいいですね。
実はリアルタイムでは最終回まで読んでないので電子版で全巻買って読みました。けっこう覚えててびっくりしたけどそれくらい好きな作品だったんだなあという感じもあり、今読むと時代を感じさせる部分もあり、懐かしくもあり……まあでもいい時代だったなというか、アスキー時代のファミ通編集部よかったですね。

ダブルゼータくんここにあり

記憶にある最古のマンガ体験がこの作品で、MS少女とかいう存在に出会ってしまった作品でもあります。ぜんぶケンプファーちゃんが悪い。ひらがな五文字であおいたくなのはこいでたく先生リスペクトだったりもします。
ちょっと寓話ぽい話というか、子供であるダブルゼータくんがなにか体験して、話の最後に大人であるマラサイさんとの対話を通じて、ふんわりと物事の善悪とか倫理とかを学んでいく話が多いんですけど、子供の頃に読めてよかったですね、という感じがあります。
今読んでも押し付けがましさは感じないので、そのへんのバランス感覚が絶妙ぽい。 あと今作の紳士ジョークが好きすぎる。あおたく語の基礎はたぶんこのへんで培われてると思います。

ダンジョン飯

ダンジョン飯 1巻 (HARTA COMIX)

ダンジョン飯 1巻 (HARTA COMIX)

あとから振り返ってみるとまだ完結してないやつここに入れるのどうだろうなという感じだったんだけどまっさきに思いついた5作にこれが入ってたのでまあこの作品の自身に与えた影響よ、という感じですが、たとえばゴーストに聖水が効くというファンタジーのお約束があったとして、霊体が物質をすり抜けるなら、瓶ごと当てればいいのでは?という発想が出てきて、ブラックジャックのように瓶を布で包んで振り回してゴーストを殴るということをやる。そういう発想のするどさにセンスオブワンダーを感じるんですよね。
ダンジョン内で食糧を調達することで継続して探索可能にするっていうところに立脚してるので、本質的にはダンジョンアタックの話だと思ってます。現代版ウィザードリィですよね。
今作あといいなと思っているのは人間のことをヒューマンとか言ったりしないところで、多種族に対して比較的背が高い特徴があるのでトールマンって呼んでるところですね。この作品以降人間主観でない描き方がよく見られるようになったと思いますけど、いいことだと思います。


自分が何読んでどう感じたかみたいなことたまに振り返ったほうが自覚的になれるっぽいのでちゃんとブログ書いたほうがいいですね。書いていきます。まあ書いてるんですけど。

こちらからは以上です。

フィクションのための言語の作り方

という話をどうしてしないのかということをこれから書きます。

名前の作り方本では、まずは英語ベースでやって、それから他の言語をベースにするのがいいよ、ということを書いているんですが、一から言語を起こすほうが間違いなく独自の名前が作れます。なんでそうしないのか。

そもそもトールキンにしたってゼロベースでは言語を作っていません。名前の作り方本には書きましたが、たとえばオークは古い時代の英語の再興にすぎませんし、完全に造語であるミスリルも、元になった語彙があるんじゃないかと思っています。そしてことフィクションに関して言うなら、ゼロベースで造語をすることが物語にどんなメリットをもたらすかというと、ゼロベースの造語は既存の語彙の延長線上にはないので、読み手の全員が無からはじまります。これがメリットでありデメリットです。言語理解のハードルをコミュニケーションに組み込むならメリットになるし、そうでないならデメリットになります。

語彙レベルの造語は既存の言語をモチーフにしたほうがイメージの連想の力を借りることができるので、そのぶん物語に注力できます。物語に注力したい人はゼロベースの造語はやめましょう。


で終わってもいいのですが、それでもまだ言語を作ることにこだわりがある人には、語彙に既存の言語のモチーフを組み込むことをありにした上で、とりあえず100語作ってみてください。

作れましたか? この記事を読みながらぱっと作れるものではないですね。そもそも語彙を作るとして、何から作っていくのか。とっかかりが必要になります。

ここにスワデシュのリストというものがあります。

ja.wikipedia.org

en.wiktionary.org

207語。スワデシュが基礎語彙として選定したものです。この選定が妥当かどうかはさておいて、Wikipedia の日本語版のページに示されている太字になっている100語、これを架空の言語で作るところからやってみてください。


作ってみましたか? どれくらい作れましたか? 即興で10語作れたら、まあまあだと思います。ただそこから100語作ろうとすると、いま作った語を捨てたりする可能性が出てきます。捨てる可能性のある10語を作ってから、そこから更に100語まで増やすことができる人は、たぶんあんまりいないと思います。

100語作れたら、207語全部作りましょう。100語作れる人にはたぶんできますね。

さて……その次の目標ですが、中学英語の最低限の英単語数って何語だと思いますか? いまは1200語と言われています。というわけで中学英語の1200語分の語彙を作ってみてください。200語はたぶん含まれてるので、あとは1000語です。気が遠くなってきましたか?

ちなみに、高校入試レベルの英単語数は、約2500語です。その次が大学入試レベルの約5000語です。ところで、英語ネイティブの語彙数は中学生で2万語、大人で2万5000語以上と言われています。せめて1万語くらいは作りたいですね。

はい。

たぶんまともにやったら年単位の仕事になると思います。

シンダール語は1200語と言われています。「異世界転生したけど日本語が通じなかった」に登場するリパライン語は7000語以上、人工言語アルカには約2万語の語彙があります。アルカはおよそ12年がかりで約2万語*1ということなので、それがどういうことかはわかるかと思います。

このへんで正気に戻ったと思いますが、じゃ、必要な語彙だけ作ったらいいのでは、という疑問を持ったりすると思います。これとても難しい。たとえば、最初に語彙を作るときは、とりあえず感覚的につけます。これで10語くらいでこのやり方じゃたぶん無理と気付いて、100語くらいまで論理的に語彙を作ることを考えます。語頭や語尾の形態を品詞によって揃えるとかですね。使っていい音と使ってはいけない音も、このへんでルールを作っていくことになります。で、そうして作った言葉なんですが、いかにも作った言葉という感じになってしまう。

よく使う語は簡便な音になりやすく、普段遣いでない語は長かったり複雑だったりということがよくあります。学術語などは使う機会が少ないので転訛が起こりにくいですが、よく使う語は発話しやすいようにどんどん変化します。そういう変化を言語の中に持たせないと、説得力が出ないし、なにより似たような語彙ばかりで書く側も読む側も混乱します。よくよく考えてみると短い語彙は例外だらけじゃないですか。そういう例外を作ることをはじめるのに、どうしたって数百語くらいは出力する必要があります。それ、できますか?

完全に目が覚めたところで、ヘテロゲニア・リンギスティコというマンガを紹介します。

web-ace.jp

マンガは吹き出しの中で横書きにすることで外国語であると表現する慣習があり、この作品でも獣人語をそのように描いています。マンガだったらこれでいいわけです。さて、小説がそれでだめな理由ってあるんでしたっけ。

だいたいの小説投稿サイトは、残念ながらフォントを変えたりできません。フォントを変えられないなら変えられないなりに、やりようはあります。カギカッコの使い方を変えるとか、かなとカナを入れ替えるとか。漢字の当て字を使ってもいいと思います。適当な記号を並べてルビを振ってもいいです。言語をテーマにするだけだったら、別に言語として成立してるものを使わなくてもいいんですよ。

そうでなく、単に名前を作るだけであれば、それはおおよそ既存の言語をベースにしても何ら問題ないと思います。今更エルフと同じものを指す種族に対してエルフ以外の名前をつけたところで別段意味があるとも思わないですし、言語それ自体がテーマにならないなら、もはや言語自体を一から作る積極的な理由はありません。


ここまで読んでもまだ目が覚めない人はたぶんわたしと同類だと思うので、がんばって作っていきましょう。

*1:公称では22年ということなんだけど、後に91年から作り始めたのは嘘で、2001年からと述べている

フィクションの死と読み手のグリーフケア

ねとらぼさんに拙著「フィクションのための名前の作り方」のレビュー記事を書いていただいて、同人誌レビューノートという同人誌のレビュー記事のコーナーの存在を知ったんですが、そちらの前回の記事がこれ。

nlab.itmedia.co.jp

推しの死との向き合い方について書いた本。

この記事を読んだときは、なるほどなー、ということを思った。フィクションであっても死の喪失感はある。個人的な体験としては推しの死がそこまで後を引くことっていうのはなかったんだけど、推しに限らなければ、フィクションのキャラクターの死に感情を持っていかれて情緒が乱れた経験というのはある。そういう情緒を乱そうとする意地の悪い意図の作品があったりする。DDLCっていうんですけど。

で、フィクションの死に直面した読み手のグリーフケアってもしかしてすげー大事なんじゃないのか、ということを、ふと思ったわけなんですよね。

何がっていうわけじゃないんですけど、ワニ。100日目にメディアミックスの情報がどっと押し寄せてきて、余韻に浸らせてくれよ、って感じた人が少なからずいる。ワニにそこまで思い入れがなくても、情緒がないよね、という感じがある。

思うに、100日目をゴールに設定してそこで全部やったのってやっぱり悪手だったんじゃないのかという感じがする。事後諸葛亮になることを承知で言わせてもらうなら、後日談もWEBでやればよかったじゃん。ワニが死んだ世界を数日間に渡って公開して、作中のキャラクターのグリーフケアをちゃんとしたほうがいい。感情移入した読み手に時間を作ってあげることと、死との向き合い方、死んだ後の気持ちの整理の仕方を描いてあげること、そのへん丁寧にやったほうがコンテンツの強度高いと思うんスよね。なんなら別にここ無料じゃなくてもよくて、配信サイトとかで課金で買えるようにしてもいいんですけど、後日談込みの最終回の後でメディアミックスを打つなら、たぶん期間限定なりなんなりで無料公開しておくのがベターっぽい気はする。

後日談より100日目のほうが盛り上がりは強く、そのタイミングが一番広く遠くまでリーチする、これはたぶんそうだと思います。でも言っちゃ悪いですけど、終わり方にしか興味がない層はメディアミックスしてもどうせ買わない。単行本にも映画にも興味ない。グッズも。バズに価値なんかない。せっかく100日かけて読者を育てたのに。こういうのもっと大事にしたほうがいいですよ。信頼トークンをゲームから除外して一時的に利益を得るやり方、長期的には損なんですけど、なんでまだこんなこと続けてんのかなって感じ。

仮に書き手にとっては単なるキャラクターの死だったとしても*1、書き手がそこで読み手に強いメッセージを届けようとしてるんだったら、読み手が強い喪失感を抱く可能性はあり、そうなるだろうということはちゃんと意識したほうがよかろと思います、という話。

こちらからは以上です。

*1:今作のワニは交通事故で亡くなった作者の友人がモデルという話があるので自身にとっても他人事ではないはずなんですけど

蘇の話

結論から言うと、日本語版 Wikipedia の蘇のページに書かれている内容は、引用元の論文の結論を無視したものになっていて信頼性が乏しいので、参考文献欄から引用元の論文自体の本文に目を通したほうがいいですよ、という話。

問題だと考える記述を以下に引用する。

製造方法 現在に残る当時の文献が少ないが、製造方法は『延喜式』や『政事要略』に記され、「蘇を作る方法は、乳を一斗煎じて、一升の蘇が得られる」程度の記載であり、このまま濃縮牛乳を作っただけでは、日本の気候風土から腐敗してしまうので、なんらかの処理がなされていたとも言われている。

とあるうちの「このまま濃縮牛乳を作っただけでは、日本の気候風土から腐敗してしまうので、なんらかの処理がなされていたとも言われている」の部分だ。根拠となる参考文献として「日本古代における乳製品「蘇」に関する文献的考察」が挙げられているのでそれを見てみよう。

www.jstage.jst.go.jp

該当の文はこのあたりだろう。

次の問題はわが国の高温多湿の風土の中で, その貢納が冬の11月(元嘉暦,儀鳳暦等の太陰暦)までとされているが蘇が製造されてから宮中へ貢納されるまで1カ月間くらいの行程日数が必要なところもあり, 加熱濃縮以外に何の処理もほどこされていないとすれば, かなり乾燥したものでなければカビ等が生じたり, 腐敗したりする危険性が少なくない (後日詳細は報告するが, われわれが蘇の復元実験として牛乳を重量比で14%まで加熱濃縮してみた結果常温で放置しても1年以上カビが生えないし成分変化もほとんどない. 16%濃縮では2週間ほどでカビの発生がみられた). したがってこれを避けるため『斉民要術』,『本草綱目』等でいう酢の製法とは異なる風土的条件を加味し工夫されたわが国独特の製法による乳製品が造られなければならなかったはずである.

ここだけを読むと、「ただ加熱濃縮しただけでは日本の気候風土ではカビの発生あるいは腐敗などの危険が少なからずあるので何らかの処理が施されていたのではないか」と読めなくもない。が、ちゃんと読むと、「わが国独特の製法」がかかっているのは「酥の製法」に対してであり、「蘇は酥と異なる我が国独特の製法で作られた」と読むべきところであろう。実際、この節の結論にはこうある。

したがって蘇は相当乾燥したものであったと考えられる. その製法にみられるように全量をおよそ1/10に加熱濃縮した全粉乳のようなものであったと推定され, 酥油といったバターのような酥とは異なるものである点がとくに重要である.

このように参考文献では「蘇は1/10に加熱濃縮した全粉乳のようなもの」と推定している。確かにちょっと誤解しやすい表現だが、よくよく読めば「かなり乾燥したものでなければ」腐敗やカビの危険があるということは、逆に「かなり乾燥したもので」あれば加熱濃縮だけでも日本の気候風土においてもカビや腐敗を生じさせず長期間保存できただろう、と言っているわけだ。

なお、ホルスタインの乳のうち水分はおよそ88%で、14%に濃縮するということはかぎりなく水分を飛ばした状態ということになる。当時正確に計量することはむずかしかったろうし、実際鍋にこびりついた分ロスが発生することが考えられるので、1リットルの牛乳から作られた蘇はやはり100グラム程度だったのではないかと思う。論文にあるように、かぎりなく水分を飛ばしさえすれば、よほどカビにとって好ましい雰囲気下でないかぎり常温でも保存できただろうと思う。逆に醗酵させれば大丈夫という話もまったくなくて、チーズだって適切な環境下でなければ腐敗もするし好ましくないカビも生える。冷蔵庫の中のシュレッドチーズにアオカビが生えてるのを見たことがある人も少なからずいると思う。

参考文献はちゃんと読んで書きましょう。Wikipediaの記述は鵜呑みにしないようにしましょう。

こちらからは以上です。

ブログのリスク、生テキストのメリット

これは今から何年前のことだったか、自前でレンタルサーバWordPress置いてブログ書いてたことがあります。まあ今でもWordPress便利だと思うんですが、WordPressってブログシステムとしては圧倒的なシェアがあって、そういうよく普及してるシステムっていうのは攻撃者にとってもよく研究されてるシステムってことでもあります。

ある日DB壊れてるのに気付いて見に行ったら見慣れないファイルが生えててなにかと思ったら攻撃の痕跡だったんですね。攻撃を受けてDBが壊れたのかどうなのか今となっては知る術がないんですが、DBが壊れてるので復元のしようもなく、諦めて Tumblr に引っ越した……という経緯があります。

Tumblr は当時は日本語でいちおう書けていたこともあってしばらくは Tumblr に記事書いてたんですけど、いつ頃だったか入力画面のUIが刷新されて、それから日本語入力が壊れるようになった。まともに入力できないので、生テキストで書いて貼り付けるっていうことをやってなんとかしてたんですけど、まあ大変なわけです。

ブログは気軽に入力できたい。

はてなブログを起こしたのは今から4年前、プログラミング以外のことを気軽に書くためにはじめたんですけど、はてなブログは国産でもあり、当時 Markdown で書けるブログもなかったこともあり、これ一択という感じだったんですが、おかげで今もちょくちょく記事を書き起こせるくらいには続いています。

はてなはてなダイアリー終了時にもはてなブログへのシームレスな移行ができるようにしていて、データのポータビリティっていう観点では割と信頼しているんですが、はてなの外にデータをエクスポートすることはいまのところできない。はてながいつまでも存在する保証はないので、これなんとかなってほしいんですよね。

で、そういうときに生のテキストデータを自分で持っておくと、不慮の事態に備えることができます。公開するしないは別にしても、日記のかわりにもなるわけで、当時の自分がどういう考えだったのか思い起こしたりはできる。2000年代のログとか今見るとけっこうきついんですけど、まあでも、ないよりはあってよかったなと感じます。残ってないログも多くて、そのへんはもう思い出すことさえできない。できたほうがいいですね。

このブログは下書きとかせずに入力画面から一気に書いててとりとめもない感じになってるんですが、ちゃんとした文章を残しておきたい人は手元でテキストファイルを書いてアップするほうがいいんじゃないかと思います。まあ公開後に誤脱修正したりすると反映が面倒なんですけど。github に push したら公開されるタイプのブログはそのへん理にかなってますね。手元の git リポジトリにはコミットしてるかぎりの編集履歴があるわけだし。

そういうわけで、大事なテキストはブログだけじゃなくてどこかに持っておいたほうがいいですよ、っていう話でした。