2023-09-26

Bloggerのxml処理

以下は、Bingチャットへのお願い文。一気に片付いてしまい、1344の文書をObsidianで扱えるように変換して、引っ越しさせた。

ーーーーー

Pythonのコーディングをお願いします。
PyQt5を用いたCUIによって入力するxmlファイルを定義する。解析の結果以下の3つの要素を単位とするセクションを一つのファイルとしてMarkdown文書として切り出してください。出力先は入力ファイルのディレクトリの下に「XML_cohtets」というディレクトリを作成しその中に書き込んでください。ファイル名は第一要素のなかから「最初の10桁(YYYY-MM-DD)」に半角アンダーバーを挟んで第二要素に拡張子mdを加えたものとします。書き込む順番は、第二要素、第一要素、第三要素、とします。なお、XmlParcerによる表示は必要としません。ファイル名には、一部の文字(例えば、`/`や`\`など)を含まないよう、削除してください。`content`要素が存在しないか、または存在していてもテキストが空(None)のエントリーがある場合、`content`をファイルに書き込む前に、それが`None`でないことを確認してください。書き込み終了時点で、書き込んだファイル数、「終了しました」を表示してください。

1:Element: {http://www.w3.org/2005/Atom}published, Element name:
2:Element: {http://www.w3.org/2005/Atom}title, Element name:
3:Element: {http://www.w3.org/2005/Atom}content, Element name:

2023-09-25

Obsidianとこれまでのノートアプリ、ブログ、そしてEvernote

 以前にもどこかに書いたことだが、これまで使ってきたノートアプリ関係について、書いておこうと思う。

古くはCalendarMemoというのを使っていて、そこに書いていたものは、パソコン(わたしはMacユーザだが)を更新したどこかのタイミングでデータが散逸してしまった(PowerMacで動いていた記憶なので、おそらく2000年代後半ごろ)。たしか、データは年月日の順に階層的なディレクトリに入っていたと思う。

このあと、多分ノートアプリではなく、Macのワープロをつかっていたか?MicrosoftWordに切り替えるまでのノートは今となっては表示も変換もできない(ひょっとしてできるかもしれないが、諦めている)。必要なものは、Wordに変換してあったので、1995年のものまで遡ることができる。その前のものは、日記のようなものは手書きだったと思う。みつけてあるものの、これは、スキャンしなければならない。

次に使ったのは(間が空いているので、なにか別のものを使っていたような気がするが)DayOneだった(2012-2017)。便利使いしていたが、バージョンアップと有償化のタイミングで、おそらく、並行して使っていたSimplenoteに切り換えた(2011-2023)。

Evernoteについては、古いユーザである(2008-現在)。ノートの数も現在では28000に届こうとしている。蓄えたノート、はたしてうまく利用できているのかどうか、タグをつけたり、ノートブックに分けたりするが、馬一つ有効利用できているとは言い難い。

2023年2月すえ、Obsidianのことを知り、Evernoteにもリンクを貼れることがわかった。また、これまでのDayOneやSimplenote に書いていた内容をObsidianに移行できることもわかった。同じような頃、ChatGPTをコーディングに活用できることを知った(手間はかかるが、Python初心者としては心強い)。ChatGPT-3.5の力を借りてPythonのコードを作って、引越し作業をおこなった。

ノートの他にブログに書いていることもObsidianに吸い上げることができれば、過去に書いたものを活用できるのではないかと思いつき、Niftyだったかは以前データを吸い上げていたし、gooブログの「読書と夕食」 とはてなダイアリーは、バックアップからPythonを使って吸い上げた。はてなダイアリーはもう少し細工が必要だが、それでもとりあえずは、うまく吸い上げることができることがわかった。

 さて、問題はここ、Bloggerである。バックアップはご丁寧に膨大な情報(どのような役に立つのか不明だが)を含むxml形式で出力される。これは、何処か別のブログに吸い上げるならともかく、Markdown形式のテキストに変換するというのも、Pythonをつかって作業するんだろうな。