Tuesday, January 15, 2019

Parsing Data Dengan Python


Hallo Guys 😂
Kali ini aku akan membagikan tutorial parsing data atau / scraping dengan python
di android

Sebelum itu bantu author Dengan Click iklan dan biarkan beberapa detik ya gan ya , semoga author tambah semangat untuk memperbarui artikel di blog ini setiap hari

Kita Akan Mencoba parsing Dari Blog Page Saya ini Contoh Page


siap kan dulu peralatanya

  • Termux :
sehabis itu install dulu python dan juga module nya caranya

pkg install python pip install requests  pip install bs4

ok pribadi saja kita sanksi aktivitas nya pertama buka dulu quick edit atau nano editor
Tampilan Untuk Quick Edit 

Tampilan Untuk Nano Editor (tools bawaan termux)

Selanjutnya import dulu module requests dan bs4

import requests from bs4 import BeautifulSoup  url = 'https://petitermux.blogspot.com/p/belajar-bs4.html?m=1' with requests.Session() as c:     respon = c.get(url)     soup = BeautifulSoup(respon.content, "html.parser")     print(soup.prettify())
note : alamat url dapat agan ganti yang lainya

sehabis agan membuatnya menyerupai di atas silahkan coba jalankan dan karenanya akan menyerupai di bawah ini

<a href="https://petitermux.blogspot.com/" rel="nofollow">          </a>         </span>         <span>          berguru bs4         </span>        </div>        <div class="blog-posts hfeed">         <!--Can't find substitution for tag [defaultAdStart]-->         <div class="date-outer">          <div class="date-posts">           <div class="post-outer">            <article class="post hentry">             <h1 class="post-title entry-title">              berguru bs4             </h1>             <div class="post-info">              <span class="item-control blog-admin pid-2102565653">               <a href="https://www.blogger.com/page-edit.g?blogID=2743239978184035798&amp;pageID=5128740299106525223&amp;from=pencil" title="Parsing Data Dengan Python">                <img alt=" Kali ini aku akan membagikan tutorial parsing data atau  Parsing Data Dengan Python" class="icon-action" height="18" src="https://img2.blogblog.com/img/icon18_edit_allbkg.gif" width="18"/>               </a>              </span>             </div>             <div class="post-header">              <div class="post-header-line-1">              </div>             </div>             <div class="post-body entry-content" id="post-body-5128740299106525223">              ini yakni halaman pembelajaran scraping data dengan bs4              <br/>              <br/>              kunjungi terus blog ini, alasannya disini banyak tutorial tutorial menarik untuk termux              <br/>              <br/>              kunjungi juga channel youtube di sana daerah aku mengupload video video tutorial untuk termux              <div class="clear">              </div>             </div>
ini hanyalah potonganya saja

ok selanjutnya
kita akan mencoba mencari beberapa bab dari blog di atas seperti
• title
• deskripsi blog
• link dll
untuk lebih jelasnya silahkan lihat aktivitas di bawah ini
import requests from bs4 import BeautifulSoup  url = 'https://petitermux.blogspot.com/p/belajar-bs4.html?m=1' with requests.Session() as c:     respon = c.get(url)     soup = BeautifulSoup(respon.content, "html.parser")     print("1", soup.title)      print("2", soup.title.name)     print("3", soup.title.parent.name)     print("4", soup.p)     print("5", soup.p['class'])     print("6", soup.a)   
silahkan save dan jalankan maka karenanya akan menyerupai di bawah ini

1 <title>belajar bs4 - Jejaka Tutorial</title>                      2 title 3 head                                          4 <p class="description"><span>Blog ini ihwal tutorial seputar termux, dunia hacking, pemrograman, dll </span></p> 5 ['description'] 6 <a href="https://petitermux.blogspot.com/">Home</a>

dengan module bs4 ini kita dapat mencari link link yang tersimpan di dalam blog
caranya :
import requests from bs4 import BeautifulSoup  url = 'https://petitermux.blogspot.com/p/belajar-bs4.html?m=1' with requests.Session() as c:     respon = c.get(url)     soup = BeautifulSoup(respon.content, "html.parser")     for link in soup.find_all('a'):         print (link.get('href'))
dikala agan menjalankan nya maka outputnya akan mengeluar kan banyak link yang terkandung dalam blog ini menyerupai di bawah ini
https://petitermux.blogspot.com/ https://petitermux.blogspot.com/p/about.html https://petitermux.blogspot.com/p/name-email-address-important-content.html https://petitermux.blogspot.com/p/div-idbptocloading-toc.html https://m.youtube.com/channel/UCn5d8Xbp0yt-SWTmxwtayvQ              https://petitermux.blogspot.com/ https://petitermux.blogspot.com/p/termux.html https://petitermux.blogspot.com/p/mining.html https://petitermux.blogspot.com/p/nuyul.html            https://petitermux.blogspot.com/p/hack.html?m=1 https://petitermux.blogspot.com/ https://www.blogger.com/page-edit.g?blogID=2743239978184035798&pageID=5128740299106525223&from=pencil                                                 https://www.blogger.com/comment-iframe.g?blogID=2743239978184035798&pageID=5128740299106525223 https://petitermux.blogspot.com/feeds/posts/default http://facebook.com/Jejaka-Tutorial-2230728320541897 http://plus.google.com/106273771548209106947 https://youtube.com/channel/UCn5d8Xbp0yt-SWTmxwtayvQ                   http://instagram.com/lutfi_ainun_32

selanjutnya kita akan mencari blog post atau postingan aku dari url di blog ini

Sebelum itu Agan Harus Tau Id dari bab yang akan agan ambil
untuk mengetahui nya caranya
pertama silahkan masukk ke browser anda
pastekan di url browser view-source:https://petitermux.blogspot.com/p/belajar-bs4.html?m=1
kemudian cari id yang akan agan ambil, sebagai pola agan dapat lihat gambar di bawah ini

ok selanjutnya silahkan simak penggalan aktivitas di bawah ini

import requests from bs4 import BeautifulSoup  url = 'https://petitermux.blogspot.com/p/belajar-bs4.html?m=1' with requests.Session() as c:     respon = c.get(url)     soup = BeautifulSoup(respon.content, "html.parser")     print(soup.find(id='post-body-5128740299106525223').text)

silahkan save dan jalankan
outputnya kurang lebih menyerupai di bawah ini
ini yakni halaman pembelajaran scraping data dengan bs4                                                                    kunjungi terus blog ini, alasannya disini banyak tutorial tutorial menarik untuk termux  kunjungi juga channel youtube di sana daerah aku mengupload video video tutorial untuk termux

Hasil nya sama dengan postingan aku yang ada di blog saya

sumber : 


sekian dari aku terima kasih

Add Comments


EmoticonEmoticon