メモφ(..)

HTMLParserを使ってタグ情報を取得する

defは関数を作成するときの定義文

__init__とか、__name__とかってなんや!!
配列①
getURL=テスト1

getURL内にあるリンク先URL取得(配列①)
繰り返し 配列①
    getURL=配列①のURL
    getURL内にあるリンク先URL取得(配列①)追加
繰り返し 終わり


繰り返し2 配列①
    getURL内にあるタグ内の値取得
    getURL内にあるタグ内の画像取得
    書き出し
繰り返し2 終わり



まだいろいろあるみたい


1ページ目HTMLのソース取得
リンク先URL取得
繰り返し
 pythonライブラリでタグ内の値取得
 pythonライブラリでタグ内の画像取得
 書き出し
繰り返し終わり


これだとリンク先URLにさらにリンクがあると見れなーい、、


python、ruby、PHPを覚えたい

Webスクレイピングはまずはpythonから。


Progateアプリをインストールしたが、有償版までは手が出ず、、

無料範囲は少しの記述方法しかなく気休め程度かな
それでも無料範囲内はすべてやってみた\(^^)/


とりあえずWebスクレイピングの勉強を始めたので備忘録を兼ねてサイト解説です。



現在習得済みの言語
VB、VBA、Access、cobol

現状
メーカー
のソフト導入ベンダー
メーカーの下請け作業
SIer、SE
システム導入、カスタマイズ
保守対応


目標
SEからWebへ
Web開発、フリーランス、副業、クラウドワークス、ランサーズ、副収入