'python' 카테고리의 글 목록 (2 Page)

python

로컬기반 크롤러 프로그램 2019.11.14
.ui -> .py / .py -> .exe 2019.11.14
PyQt5 를 이용한 간단한 GUI 만들기 2019.11.14
BeautifulSoup 를 이용한 크롤러 - Junnnho 2019.11.14

로컬기반 크롤러 프로그램

_JunHo 2019. 11. 14. 17:16

2019. 11. 14. 17:16

인터넷만 연결되어있다면 일정한 시간간격으로 크롤러를 해와서 정보를 띄워주는 GUI를 만들어보았다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61

import sys
import numpy as N
 
from PyQt5.QtWidgets import *
from PyQt5 import uic
from PyQt5.QtCore import QTimer, QTime
import requests
from bs4 import BeautifulSoup
 
import io
sys.stdout = io.TextIOWrapper(sys.stdout.detach(), encoding = 'utf-8')
sys.stderr = io.TextIOWrapper(sys.stderr.detach(), encoding = 'utf-8')
 
form_class = uic.loadUiType("untitled2.ui")[0]
 
url = 'https://www.yna.co.kr/it/all'
req = requests.get(url)
 
html = req.text
soup = BeautifulSoup(html, 'html.parser')
result = soup.select('strong.news-tl > a')
cnt = 0
class MyWindow(QDialog, form_class):
   
   def __init__(self):
       super().__init__()
       self.setupUi(self)
       # QTimer => 이벤트루프에 변수 timer라는 타이머 등록 
       self.timer = QTimer(self)
       # 1000(1sec)*x 단위로 이벤트루프 진입시(exec_()) 타이머시작
       self.timer.start(1500*1)
       # 타이머 지정 시간마다 이벤트발생 -> connect 를 통해 임의의 timeout def 슬롯 연결
       self.timer.timeout.connect(self.timeout)
 
       # crawling 을 갱신하기 위한 타이머
       self.timer_crawler = QTimer(self)
       self.timer_crawler.start(1000*60*5)
       self.timer_crawler.timeout.connect(self.timeout_crawler)
 
   def timeout(self):
       # globar => 전역변수를 지역범위에서 사용하기위해
       global cnt
       self.textEdit.setText(result[cnt].text)
       self.textEdit_2.setText(result[cnt+1].text)
       self.textEdit_3.setText(result[cnt+2].text)
       cnt = cnt+3
       if(cnt > 20): cnt = 0
 
   def timeout_crawler(self):
       req = requests.get(url)
       html = req.text
       soup = BeautifulSoup(html, 'html.parser')
       result = soup.select('strong.news-tl > a')
 
if __name__ == "__main__":
   app = QApplication(sys.argv)
   myWindow = MyWindow()
   myWindow.show()
 
   app.exec_()
 
http://colorscripter.com/info#e" target="_blank" style="color:#e5e5e5text-decoration:none">Colored by Color Scripter

'python > crawler' 카테고리의 다른 글

BeautifulSoup 를 이용한 크롤러 - Junnnho (0)	2019.11.14

.ui -> .py / .py -> .exe

_JunHo 2019. 11. 14. 17:02

2019. 11. 14. 17:02

py 파일을 exe 로 변환하기 위해서는 pyinstaller 이라는 라이브러리를 설치해야한다.

설치

- pip install pyinstaller

py 파일을 exe 로 변환

기본형태 => pyinstaller 파일이름.py (분할된 변환같은 느낌 dist, build...)

실행파일 => pyinstaller -F 파일이름.py

모든 라이브러리를 통합하여 하나의 실행파일로 만듬 => pyinstaller --onefile 파일이름.py

콘솔창을 띄우기 싫음 => pyinstaller --noconsole 파일이름.py

exe 파일은 dist 폴더에 생성됨

ui 파일을 py 로 변환

=> python -m PyQt5.uic.pyuic -x 파일이름.ui -o 파일이름.py

'python' 카테고리의 다른 글

Linux ) pyinstaller 배포파일 실행오류 (0)	2020.01.04

PyQt5 를 이용한 간단한 GUI 만들기

_JunHo 2019. 11. 14. 16:54

2019. 11. 14. 16:54

(본 포스팅은 window 사용자 및 visual studio 를 기준으로 작성되었습니다)

pyqt5 -> python GUI 를 작업할 수 있는 프레임워크

pyqt5 설치

- pip install PyQt5

pyqt를 사용하려면 qt designer(GUI 디자이너) 가 필요

pyqt designer 설치

- pip install PyQt5_tools

디자이너부터 실행해보자

designer.exe 위치

- ...Python\Python375\Lib\site-packages\pyqt5_tools\Qt\bin

자주 사용할 예정이라면 바로가기를 하나 만들어두는게 효율적!

딱히 건드릴 부분이 없다. Create!

허전하니 간단하게 몇가지 넣어보자

MFC 와 거의 똑같다

원하는 것들을 드래그로 Dialog에 가져오면 된다.

push Button이랑 textEdit 을 가져와봤다.

pushButton 이나 textEdit 은 하나의 객체를 뜻하고 나중에 python 으로 pyqt 코드를 만질 때 건드릴 수 있다.

pyqt의 기본 작동원리

python 코드에서 위의 .ui 에 대한 정보를 가져오면

ui 에 있는 모든 객체들을 사용할 수 있다.

초기함수인 _init_ 에서 시그널을 , 그에 맞는 슬롯을 설정한 후

exec_() 를 통해 *중요 eventLoop(무한) 에 진입하게 되고

이 루프가 돌아가는 동안 이벤트(ex : 버튼클릭과 같은 init 에서 설정한 시그널)가 발생하면

슬롯(= 함수) 이 작동되고 gui 에 보여지게 된다.

위의 설명을 간단한 코드로 설명해보자면

pushButton 을 누르면 textEdit 에 hello world! 를 출력해보자

가장 먼저 현재 보고있는 디자이너.ui 를 자신이 사용하고 있는 편집기의 프로젝트에 저장해주자

나는 hello.ui 로 저장하였다.

소스를 살펴보자

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37

import sys
 
# PYQT5 를 이용하기 위한 모듈갱신
from PyQt5.QtWidgets import *
from PyQt5 import uic
 
# 불러오고자 하는 .ui 파일
# .py 파일과 같은 위치에 있어야 한다 *****
form_class = uic.loadUiType("hello.ui")[0]
 
class MyWindow(QDialog, form_class):
   
# 초기 설정해주는 init
   def __init__(self):
       super().__init__()
       self.setupUi(self)
# 시그널(이벤트루프에서 발생할 이벤트) 선언
# self.객체명.객체함수.connect(self.슬롯명)
       self.btn.clicked.connect(self.btn_click)
 
# 시그널을 처리할 슬롯
   def btn_click(self):
       self.textEdit.setText("hello world!")
 
if __name__ == "__main__":
   app = QApplication(sys.argv)
   # myWindow 라는 변수에 GUI 클래스 삽입
   myWindow = MyWindow()
   # GUI 창 보이기
   myWindow.show()
#########################
# 이벤트루프 진입전 작업할 부분
#########################
 
# 이벤트루프 진입
   app.exec_()
 
http://colorscripter.com/info#e" target="_blank" style="color:#e5e5e5text-decoration:none">Colored by Color Scripter

이벤트루프에 진입하게 되면

프로세서는 무한적으로 이벤트발생을 기다리게 된다.

pushButton 을 클릭하는 행동 자체가 객체를 작업하는 행동이므로 이벤트가 발생하게 된다

대기 ->pushButton click -> 이벤트발생 -> 지정한 슬롯을 작업 -> 작업이 완료되면 결과를 GUI 에 띄움 -> 대기

처음공부하시는 분들께 도움이 되었으면 한다.

'python > pyqt5' 카테고리의 다른 글

pyinstaller 후 no module named PyQt5... (2)	2020.01.09
pyinstaller 후 sip , PyQt5.sip 오류 (0)	2020.01.09

BeautifulSoup 를 이용한 크롤러 - Junnnho

_JunHo 2019. 11. 14. 16:10

2019. 11. 14. 16:10

(본 글은 window 사용자를 기준으로 작성되었습니다.)

본인이 원하는 웹사이트에서 필요한 정보를 긁어오는 crawler 를 공부해보자

python, nodeJs 두개의 언어로 크롤러를 해봤는데 개인적인 경험으로는 python 코드가 더 직관적이고 쉬운 것 같다.

크롤러를 위해 설치할 라이브러리는 beautifulsoup4 와 requests 이다.

설치

pip install beautifulsoup4 (라이브러리)

pip install requests (웹 객체 사용을 위함)

설명

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33

from bs4 import BeautifulSoup
# beautifulsoup import
import requests
# requests -> 웹 객체(html)를 편하게 사용하기 위한 http requests 라이브러리
import sys
 
import io
sys.stdout = io.TextIOWrapper(sys.stdout.detach(), encoding = 'utf-8')
sys.stderr = io.TextIOWrapper(sys.stderr.detach(), encoding = 'utf-8')
# 크롤러를 성공적으로 해오게 되면 글자가 깨지는 경우가 발생한다.
# 이를 위해서 따로 선언해줘야한다
 
url = 'https://www.yna.co.kr/it/all'
# url = '크롤러를 원하는 페이지'
req = requests.get(url)
# requests 모듈을 이용하여 url 의 객체를 받아옴
 
html = req.text
# 받아온 객체 req 에 대한 text = code 를 가져옴
soup = BeautifulSoup(html, 'html.parser')
# BeautifulSoup은 html 코드를 Python이 이해하는 객체 구조로 변환하는
# Parsing 역할을 함
# BeautifulSoup를 이용해 원하는 형식의 정보를 추출
 
result = soup.select('strong.news-tl > a')
# 원하는 url에서 F12 -> Elements 탭에 들어가면
# 현재 보고있는 페이지가 어떤 형식으로 되어있는지 소스마다 체크가 가능하다.
# BeautifulSoup객체.select('가져오고자 하는 태그') 를 통하여 크롤러
# 반환형태는 array형태
 
for res in result:
    print(res.text)
 
http://colorscripter.com/info#e" target="_blank" style="color:#e5e5e5text-decoration:none">Colored by Color Scripter

select 태그 설명 (find보다 오류도 없고 간단하다)

연합뉴스/it/all 의 url 을 기준 헤드라인만 따와보자

F12 -> Elements(요소검사) 를 통해 헤드라인을 구현한 코드를 찾는다.

select 사용법

soup.select('원하는 정보')

soup.select('태그명')

soup.select('.클래스명')

soup.select('상위태그명 > 하위태그명 > 하위태그명')

soup.select('상위태그명.클래스명 > 하위태그명.클래스명') # 바로 아래의(자식) 태그를 선택시에는 > 기호를 사용 soup.select('상위태그명.클래스명 하위태그명') # 아래의(자손) 태그를 선택시에는 띄어쓰기 사용

soup.select('상위태그명 > 바로아래태그명 하위태그명')

soup.select('#아이디명')

soup.select('태그명.클래스명)

soup.select('#아이디명 > 태그명.클래스명)

이런식으로 원하는 위치를 상위 > .. > 하위 순으로 찾아나가면 된다.

당장 보이는 허성무 창원시장, 미국.... 은 strong 클래스(이름 : new-tl) 의 하위 a태그에 위치함으로

strong.new-tl > a 로 간단하게 헤드라인을 가져올 수 있다.

끗.

'python > crawler' 카테고리의 다른 글

로컬기반 크롤러 프로그램 (0)	2019.11.14

PREV 이전 1 2 NEXT 다음

Junnnho

python

로컬기반 크롤러 프로그램

'python > crawler' 카테고리의 다른 글

.ui -> .py / .py -> .exe

'python' 카테고리의 다른 글

PyQt5 를 이용한 간단한 GUI 만들기

'python > pyqt5' 카테고리의 다른 글

BeautifulSoup 를 이용한 크롤러 - Junnnho

'python > crawler' 카테고리의 다른 글

+ Recent posts

티스토리툴바