これから勉強したいと想っているのですが、
下記のようなことは、PHPでできますかね・・?
基点となるwebページよりリンクを巡回。
指定のタグとタグの間の文字を摘出、さらに、それを
csvの指定の列に入れて保存。
その他、ローカルのフォルダに入れたhtmlファイルも
フォルダを指定すれば、上記のようにその中の指定のタグとタグの間の文字を摘出、さらに、それをcsvの指定の列に入れて保存できるようにしたいです。
ページ: 1
投稿者 | 投稿 |
---|---|
#1 2009 年 2 月 21 日(土) 15:26
|
|
会員
登録者: 2 2009
返信数: 5
|
これから勉強したいと想っているのですが、
下記のようなことは、PHPでできますかね・・? 基点となるwebページよりリンクを巡回。 指定のタグとタグの間の文字を摘出、さらに、それを csvの指定の列に入れて保存。 その他、ローカルのフォルダに入れたhtmlファイルも フォルダを指定すれば、上記のようにその中の指定のタグとタグの間の文字を摘出、さらに、それをcsvの指定の列に入れて保存できるようにしたいです。 |
#2 2009 年 2 月 22 日(日) 6:54
|
|
管理者
登録者: 10 2005
返信数: 38
|
言語が備える機能としてはできます.
あとはpokoさんの持っている環境(たとえばいわゆる共有サーバーでやるのは面倒くさいと思います)とスキル次第だと思います. _______________ |
#3 2009 年 2 月 22 日(日) 13:07
|
|
会員
登録者: 2 2009
返信数: 5
|
ありがとうございます。
早速本を買って勉強をはじめました。 フォームにURLを入れて、 指定のタグとタグの間の文字を摘出、さらに、それを csvに保存。は、本を見ながらなんとかできました。 リンク先を巡回する方法が、全く・・・わかりません・・。 これが、共有サーバーするには、面倒な作業になるのです・・・? どういうキーワードで調べていったらいいですかね・・? |
#4 2009 年 2 月 23 日(月) 13:21
|
|
管理者
登録者: 10 2005
返信数: 38
|
まだ共有サーバーうんぬんの障壁の場面ではないと思いますので一旦忘れてください.
リンク先巡回は下記を段階的に学習していってください. (1) ある自分が決めたページのHTMLを取得する (2) 取得したHTMLを解析し、リンク一覧を作る (3) (*1)(2)の情報を基に(1)から繰り返す *1 ... できればきめうちで「sleep(1);」とかを入れてほしい.(see: http://php.net/sleep ) これがたぶんロジックの基本になると思います. それ以外は特定サーバーに短期間で集中アクセスしない方法(*1はひとつのアイデア),逆に同時にさまざまなサーバーにアクセスする方法,リンクがループになってしまうことの回避,...とか諸々出てくると思いますが,察するにまず1~3で時間がかかると思うのでがんばってみてください. _______________ |
ページ: 1
日本PHPユーザ会 掲示板 は UseBB 1 フォーラムソフトウェア を使用しています