목록전체 글 (59)
개발하고 싶어요
- 리눅스는 root가 최상위 디렉토리이다 - pwd : 현재 디렉토리 확인 - ls : 현재 경로에서 모든 내용 보기(옵션 : -l 상세보기 ,-h 사람이 보기 쉽도록 표시, -a 숨긴 파일(.파일명)도 모두 표시) - cd 경로 : 원하는 경로로 이동하기 - . : 자기 경로 - .. : 상위 경로 - ~ : 홈 디렉토리 - 절대경로 : 처음부터 /c ~~ - 상대경로 : 지금 위치부터 시작 - mkdir : 폴더 만들기 - rm : 파일 삭 - rm -r 폴더명 : 폴더 삭제 - vi 사용법 - esc -> : -> wq(저장 후 나가기) q!(저장 안 하고 나가기) - i : 편집하기 - nano : 추천하는 텍스트 편집기
정적 웹크롤링¶ In [1]: import urllib.request from bs4 import BeautifulSoup # 특정 웹 페이지의 HTML을 스크랩하여 데이터를 수집할 때 사용 In [169]: response = urllib.request.urlopen('https://www.naver.com') # 응답 html_str = response.read().decode('utf-8') # 응답한 내용을 가져오기 In [170]: bs_obj = BeautifulSoup(html_str, 'html.parser') # 'html.parser'는 BeautifulSoup이 사용할 파서를 지정하는 부분 print(type(bs_obj)) In [13]: # 'strong' tag 첫 번째 요소 찾..

● 기본적인 웹크롤링(네이버) - 네이버 애플리케이에서 정보 추가하기(아이디, 비번) - GET 방식(?로 이어지며 '변수 = 값'형태) POST는 바디 안에 정보가 있다 - XML(html구조)와 JSON(key, value) 형식을 지원 - 검색할 파라미터 - 해보기 - 요청할 때 headers에 애플리케이션 아이디와 비번을 지정 - 이미지를 가져오고 싶은 경우 -> json앞에 변경 ● 파이썬에서 해보기 라이브러리 불러오기¶ In [57]: import urllib.request # url을 가져오기 위해 import json # 입력 받을 때 json으로 받기 위해 import pandas as pd from IPython.core.interactiveshell import InteractiveS..

● 계정 생성 후 권한 설정 ● aaa로 접속 후 테이블 생성 - VARCHAR은 내가 쓴 만큼만 메모리 사용 - CHAR은 정해진 메모리 사용 -> 적은 이름일 경우 메모리 낭비가 있을 수 있다 - sysdate는 값을 입력하는 순간 들어가도록 ● 데이터 삽입 - sql입력 - commit 꼭 하기 INSERT INTO LOGIN (ID, PW) VALUES('aaa', 'bbb'); SELECT * FROM LOGIN; - 직접 입력 ● SQL 구문 - 전체 데이터 확인 select * from lunch; commit; - 점수 확인 -- 점수의 종류를 보고 싶다. select DISTINCT score from lunch order by score DESC; - 데이터 삭제하기 -- 잘못된 정보(..