개발/ETC

    [python] 문자열 _ n-size 나누기

    문자열을 입력받아서 원하는 길이로 자르기 위한 방법! def split_len(seq, length): return [seq[i:i+length] for i in range(0, len(seq), length)] seq='f09f9989x' length=2 [seq[i:i+length] for i in range(0, len(seq), length)] => ['f0', '9f', '99', '89', 'x'] ---------------- 길이가 홀수일때 마지막 수 버리는 방법 ▼ seq='f09f9989x' length=2 [''.join(x) for x in zip(*[list(seq[z::length]) for z in range(length)])] # map(''.join, zip(*[iter(s..

    [python] zsh: command not found: conda 에러 해결

    conda 명령어 사용시 에러가 났다. zsh: command not found: conda #입력시 zsh가 나오면 경로를 명시해줘야한다. echo $SHELL 아나콘다가 설치되어 있음에도 경로 에러가 나는 이유는 bash와 다르게 zsh는 경로가 자동으로 지정되지 않는다고 한다. 1. zshrc 파일 열기 vi ~/.zshrc vim 명령어 확인 더보기 1. 저장만 :w 2. 종료만 :q 3. 강제종료 :q! 4. 저장 후 종료 :wq 5. 번호 확인 :set nu 6. 줄 전체 삭제 dd 2. anaconda path 명시 #username 확인 echo $USER #경로명시 export PATH="/Users/[UserName]/opt/anaconda3/bin:$PATH" 3. conda 명령어 ..

    [python] 경향_원하는 섹션별로 전문 가져오기

    위와 같은 내용으로 크롤링을 진행하였고 내가 맡은 부분은 중앙일보와 경향이었다. 중앙일보는 페이지가 일관되어있고 섹션, 기간 등등 설정값을 조절 할 수 있어 매우 편리했는데, 경향은 아니었다 ㅠㅠ 뿐만 아니라 경향은 2000.08월부터 자료가 존재하여 그 이전 데이터는 찾을 수가 없었다.. 경향이 날 너무 괴롭혀서 머리가 아프다. 내가 바보인것도 맞지만🤮 누군가 내 글을 읽고 좀 편하게 자료를 추출할 수 있었으면 좋겠다.. 특히 나는 [Errno 54] Connection reset by peer 이 오류에서 한참 헤맸는데 ㅠㅠ 그냥 예외처리하면 되는거였다 2번 자료에 그렇게 진행한 코드를 작성해놓았다. (웹 크롤링과 스크레핑 대해서 공부해야겠다는 생각......) 1. 링크만 추출하는 방법 위 자료에 ..

    [python] 중앙일보 크롤링

    하나도 정리되지 않은... 코드 기간,키워드,최신순, 분야 고정시켜놓고 기사 전문을 가져오는 코드이다! RESULT_PATH = '경로' now = datetime.now() #파일이름 현 시간으로 저장하기 def get_url(): params =[] for page in tqdm(range(50)): #일부분만 기간,키워드,최신순, 분야 고정 url2 = f'https://news.joins.com/Search/TotalNews?page={page}&Keyword=%EC%B2%AD%EB%85%84&PeriodType=DirectInput&StartSearchDate=01%2F01%2F1987%2000%3A00%3A00&EndSearchDate=12%2F31%2F2020%2000%3A00%3A00&So..