paloma blog

NWエンジニアやってます。主に自宅環境のお遊びを書きます。Pythonもちょっと。タイトルは好きなカクテルから。

コンピュータ・サイエンス入門4

Lesson1の講義が完了しました。 確認のHomework中です。

  • 内容サマリ
    • ページからurlを抽出するコードをかく
    • a hrefタグを探して前後の"位置を見つける
    • 位置のインデックスをつけてurlを出力する
  • コード
    • ページ内リンクの抽出
page =('<div id="top_bin"><div id="top_content" class="width960">''<div class="udacity float-left"><a href="http://udacity.com">')

start_link = page.find('<a href=')
starthttp = page.find('http',start_link)
end_link = page.find('"',starthttp+1)
url = page[starthttp:end_link]
print url
  • 進捗率
    • Lesson1:41/41完了

変数名は適当につけましたが、もっとセンスある名前考えたい。

取り急ぎスマホから更新です。 ソフトウェアキーボードだとかく気力がなくなりますね。