Lấy nội dung từ trang web khác bằng PHP Simple HTML DOM Parser không khó, nhưng đòi hỏi người dùng phải có một số kiến thức cơ bản về HTML. Đây được giá là một phương pháp đơn giản, dễ sử dụng và mang đến hiệu quả cao. Bạn có thể tải PHP Simple HTML DOM Parser về để sử dụng.

Đang xem: Lấy dữ liệu từ website khác bằng php

 LẤY NỘI DUNG TỪ TRANG WEB KHÁC BẰNG PHP SIMPLE HTML DOM PARSER

Hiểu đơn giản PHP Simple HTML DOM Parser là một thư viện có chức năng chính là trích xuất nội dung HTML từ một trang nào đó hoặc một đoạn HTML do do bạn tự cung cấp.

*

Chương trình này giúp bạn có thể dễ dàng bóc tách dữ liệu theo từng id, class, hoặc thẻ img, a, table,…Code này khá ngắn nên dễ nhớ, dễ học và dễ viếtNgoài ra, chương trình này cũng khá nhẹ nên bạn có thể yên tâm sử dụng

CÁCH SỬ DỤNG PHP SIMPLE HTML DOM PARSER

Bạn vào địa chỉ http://simplehtmldom.sourceforge.net và tải chương trình về máy để bắt đầu việc sao chép nội dung. Sau khi đã có thư viện bạn copy file simple_html_dom.php vào dự án của mình và include nó vào file bạn muốn lấy dữ liệu để có thể sử dụng. Để đọc nội dung một file, bạn tiến hành như sau: 

12 $html = file_get_html('link cần lấy');echo $html;

Chỉ cần bỏ link vào là bạn đã có thể cho ra toàn bộ nội dung của một trang web.Để hiển thị hình ảnh bạn sử dụng đoạn mã sau: (Trong đó, biến $html bạn chỉ cần khai báo một lần trong file)

1234 $html = file_get_html('http://www.google.com/');foreach($html->find('img') as $element) { echo '';}

Hiển thị tất cả các link trong bài viết.

Xem thêm:

12 foreach($html->find('a') as $element) echo $element->href . '';

Lấy nội dung từ một id cụ thể (Tương tự nếu muốn lấy thẻ class, table, p,…)

1 $noidung = $html->find('#ten_id',0);

Nếu muốn lấy phần tử trong một phần tử. Ví dụ trong nội dung file có một id tên là properties. Trong properties có một đoạn text và một list danh sách thuộc tính nằm trong thẻ li. Nếu cần lấy chuỗi li này thì bạn tiến hành như sau:

1234 $thuoctinh = $html->find('#properties',0)->find('li');foreach ($thuoctinh as $e) { echo $e->plaintext};

*


Có 3 cách đọc nội dungplaintext: Lấy nội dung (text) từ trang webinnertext: Chỉ lấy nội dung bên trong thẻ..outertext: Lấy cả thẻ và nội dung bên trong.Nếu bạn muốn thay đổi nội dung của một trang trước khi xuất

1 $html->find('table',0)->outertext='';

Sau khi sửa nội dung, bạn sử dụng thêm đoạn mã bên dưới để lưu lại nội dung trước khi xuất.

Xem thêm:

1 $html ->load($html ->save());

Như vậy, công ty thiết kế web chuyên nghiệp iMarketing vừa hướng dẫn các bạn cách lấy nội dung từ trang web khác bằng PHP Simple HTML DOM Parser. Mời các bạn tham khảo để có thêm thông tin.

Leave a Reply

Your email address will not be published. Required fields are marked *