paloma blog

NWエンジニアやってます。主に自宅環境のお遊びを書きます。Pythonもちょっと。タイトルは好きなカクテルから。

コンピュータ・サイエンス入門4

udacity

Lesson1の講義が完了しました。確認のHomework中です。

内容サマリ
- ページからurlを抽出するコードをかく
- a hrefタグを探して前後の"位置を見つける
- 位置のインデックスをつけてurlを出力する
コード
- ページ内リンクの抽出

page =('<div id="top_bin"><div id="top_content" class="width960">''<div class="udacity float-left"><a href="http://udacity.com">')

start_link = page.find('<a href=')
starthttp = page.find('http',start_link)
end_link = page.find('"',starthttp+1)
url = page[starthttp:end_link]
print url

進捗率
- Lesson1:41/41完了

変数名は適当につけましたが、もっとセンスある名前考えたい。

取り急ぎスマホから更新です。ソフトウェアキーボードだとかく気力がなくなりますね。