일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 내심정
- 여행 #
- 추억
- 영국
- 배낭여행
- 메시지 큐
- 계획
- 파이썬
- ip
- 유럽
- RabbitMQ
- 실비용
- 여행
- IT
- 겨울
- JAVA #언어 #프로그래밍 #코딩 #static #정적함수 #정적변수 #클래스
- 일정
- JAVA #객체지향 #프로그래밍 #언어 #IT #기초
- #DB#SQLD#자격증
- 경험
- 샐러리
- 유럽여행
- 이탈리아
- 예약
- 준비
- 서버
- 인프라
- JAVA #언어 #프로그래밍 #IT #개발 #코딩
- 1달살기
- 리눅스
- Today
- Total
YoonWould!!
파이썬을 이용해 간단한 크롤링 애플리케이션을 구현해보겠습니다. 참고한 책은 python 개발자를 위한 파이썬이라는 책을 참고하여 구현하였습니다. 먼저 스크래피(scrapy)를 사용합니다. 스크래피 파이썬으로 만들어진 대표적인 크롤러입니다. 크롤링의 프레임워크라고도 할 수 있습니다. 스크래피의 장점 - 스크랩할 항목 유형을 정의하는 클래스를 만들 수 있습니다. - 수집한 데이터를 원하는 대로 편집하는 기능을 제공합니다. - 서버에 연동하기 위해 기능을 확장할 수 있습니다. - 크롤링 결과를 JSON, XML ,CSV 등의 형식으로 내보낼 수 있습니다. - 손상된 HTML 파일을 분석할 수 있습니다. 스크래피를 이용해서 크롤러를 만드는 대략적인 과정 1. 크롤링할 아이템을 선정 2. 실제 크롤링할 스파이더(..

클러스터 여러 대의 컴퓨터들이 연결되어 하나의 시스템처럼 동작하는 컴퓨터들의 집합 기본적으로 고속 근거리 통신망으로 구성된다. 서버로 사용되는 노드에는 각각의 운영 체제가 실행된다. => 이더넷, Wifi와 인터넷 프로토콜인 TCP/IP를 사용한다. 요즘은 무선랜(IEEE 802.11 시리즈)도 많이 사용되고 있다. 클러스터 특징 - 작업 부하분산(Load-Balancing) 클러스터는시스템의 전반적인 성능을 향상시키기 위해 계산 부하량을 여러 노드에서 분담하여 병렬 처리하도록 구성 하는 방식이다. 웹서버 클러스터의 예를 들면, 각기 다른 종류의 요구들을 각기 다른 노드에서 처리하도록 할당함으로써 전반적인 응답시간을 최소화 할 수 있다. 그렇지만 애플리케이션에 따라 작업 부하를 분산하는 방법은 크게 다를..

기본 개념 Elasticsearch에서는 몇 가지 핵심 개념을 사용합니다. 처음부터 이 개념을 알아두면 훨씬 더 수월하게 학습할 수 있습니다. NRT(Near Realtime) Elasticsearch는 NRT 검색 플랫폼입니다. 즉 문서를 색인화하는 시점부터 문서가 검색 가능해지는 시점까지 약간의 대기 시간(대개 1초)이 있습니다. 클러스터 클러스터는 하나 이상의 노드(서버)가 모인 것이며, 이를 통해 전체 데이터를 저장하고 모든 노드를 포괄하는 통합 색인화 및 검색 기능을 제공합니다. 클러스터는 고유한 이름으로 식별되는데, 기본 이름은 "elasticsearch"입니다. 이 이름은 중요한데, 어떤 노드가 어느 클러스터에 포함되기 위해서는 이름에 의해 클러스터의 구성원이 되도록 설정되기 때문입니다. 동..