bunzip2, gzip 커맨드가 설치되어 있는 경우 다음과 같이 해결할 수 있다.


bunzip2 -c < input.bz2 | gzip -c > output.gz


변환할 파일이 많은 경우 파이썬 스크립트로 변환을 하도록 하자.

import os for i in range(1,100): print("bunzip2 -c < data-%05d.bz2 | gzip -c > data-%05d.gz" % (i, i)) os.system("bunzip2 -c < data-%05d.bz2 | gzip -c > data-%05d.gz" % (i, i))




작성시작: 2016-10-20, 최종수정: 2016-10-20


Note: 2014년 자료로 작성하였음. 현재 내용이 다를 수도 있으니 추가 확인 필요


Druid로 실시간 분석하기


실시간

  • 여기서 실시간이란 수십초안에 응답 및 실시간 ingestion을 을 의미


Analytics

  • 데이터를 클렌징, 변환, 모델링해서 정보를 찾는 프로세스

Business Intelligence
  • 비즈니스 정보에 초점을 맞춘 애널리틱스

Druid란?
- google dremel에서 영감을 얻음
- 오픈소스 OLAP 엔진
- aggreation을 수십초안에 해결
- 메모리 매핑 데이터 사용

특징
- de-normalized data
- time-based segments
- timeseries/groupby/TopN 처리에 강함
- Hadoop과 잘 동작

메인 컴포넌트

* 인덱싱 서비스
 - 실시간 ingestion
 - hadoop 배치 ingestion
 - 로컬 배치 ingestion
 - 인덱싱 단계에서 aggregation 정의
 - 최종 결과: 데이터 세그먼트를 deep store에 저장. 각 세그먼트는 시간범위를 가지고 있음

* 코디네이터 노드
 - MySQL 메타데이터 읽기 조정. 

* 브로커 노드
 - 질의를 세그먼트를 가진 노드에 전달
 - partial aggregation 결과를 취함

* 히스토리컬 노드
 - deep store에 있는 immutable 인덱스 데이터를 로딩

* 실시간 노드


왜 Druid를 일까?

장점
- Horizontal Scalability - 선형 성능 보장
- 수초안에 응답시간(실시간급)
- 네이티브 타임존 지원
- 통합 버전( 배치 + 실시간 ingestion/질의 지원, 분산 memcached 지원, 멀티티어 복제/로드 지원)
- 활발한 커뮤니티

단점
- SQL/MDX보다 제한적인 질의 (빅쿼리는 ANSI SQL지원)
- 조인이 힘듬
- distinct 카운트 불가
- groupby 질의시 메모리 제한 있음


참고: http://www.slideshare.net/ydn/pushing-thelimitsofrealtimeanalyticswithdruidv3



sublime text를 설치하여 한글을 입력하니 커서 위에 한글 조합상태가 나오지 않고
좌측 상단에 한글 조합 상태가 나와서 불편했는데 다음과 같이 수행하면 커서위에 한글 조합상태를 볼 수 있다.

  • Preferences > Package Control 선택
  • Package Control : Install Package 선택
  • IMESupport 선택하여 설치
이후에는 한글입력이 원하는대로 잘된다.



https://github.com/open-guides/og-aws/blob/master/README.md




sublime text 3를 설치하고 다음과 같이 bootstrap snippet을 설치하면 편하게 입력을 할 수 있게 된다.


맥에서 설치하는 법

  • Sublime Text > Preferences > Package Control 선택
  • Package Control: Install Package 입력
  • Bootstrap Snippets 선택

사용법
  • 그 다음 부터는 편집 파일의 syntax를 html로 선택하고  <다음 태그명을 입력했더니 자동으로 템플릿이 채워진다.


약어

  • 간단하게 앞단어만 축약해서 써도 템플릿 입력이 가능한다.
  • 예를 들어 templage:navbar를 입력하고자 하는 경우 <tn만 입력해도 바로 선택창이 뜬다.



EMR에서는 YARN을 통해서 Spark을 구동할 수 있다.

이 때 현재 실행중인 Spark Job을 보고 싶은 경우가 있는데 Web UI를 보고 싶다면

다음과 같은 단계를 거쳐야 한다.

  • 터널링하여 Resource Manager 접속
  • 해당 job의 ApplicationMaster 링크 클릭

주의
  • ResourceManager를 거치지 않으면 이미지가 깨져나온다.
  • 따라서 YARN Resource Manager를 거치도록 한다.



페이지 이동

  • PageUp: Fn + Up, Shift + Space
  • PageDown: Fn + Down, Space
  • Home: Fn + Left
  • End: Fn+ Right


단어간 이동

  • 뒷 단어: Opt(Alt) + Left
  • 앞 단어: Opt(Alt) + Right



팬이 시끄러워 RPM을 줄이는 프로그램을 찾아보았다. 

아래 링크의 프로그램의 RPM을 줄일 수 있는데, 임의로 줄이는 것은 불안하여 CPU 점유율 높은 프로그램을 죽이고

RPM이 줄고 있나 확인하는 용도로 사용하고 있다. 


다운로드 사이트: http://crystalidea.com/macs-fan-control

--


참고글: http://gong6587.tistory.com/2465

+ Recent posts