본문 바로가기

Bigdata/druid

Druid 정리(5)

쿼리

Aggregation Queries

· Timeseries

· TopN

· GroupBy


Metadata Queries

· Time Boundary

· Segment Metadata

· Datasource Metadata


Search Queries

· Search


어떤 쿼리를 사용해야 하나?

· GroupBy 대신에 Timeseries나 TopN을 사용하는 것을 추천한다.

· GroupBy는 드루이드에서 가장 유연하지만 가장 성능이 낮다.

· Timeseries는 GroupBy보다 분명히 빠르다.( 디멘전을 그룹핑해서 요청하는 집계가 아닐 경우)

· 싱글 디멘전에서 그룹핑과 정렬은 TopN 쿼리가 GroupBy보다 더 최적화돼있다.


집계 쿼리 사용은 결론적으로..

· 그룹핑 없이 전체 소스에 필터링, 집계, 정렬을 할 경우 -> Timeseries query

· GroupBy에 하나의 디멘전만 포함된다면 -> TopN 쿼리

· GroupBy에 여러 디멘전이 들어가면 -> GroupBy를 하면 되는 것 같다.


쿼리 취소

· 쿼리는 유니크 ID를 이용하여 명시적으로 취소가 가능하다.

· 만약 쿼리ID가 abc123이라면 쿼리는 다음과 같이 취소가 가능하다.

curl -X DELETE "http://host:port/druid/v2/abc123




'Bigdata > druid' 카테고리의 다른 글

Druid 정리(4)  (0) 2019.03.30
Druid 정리(3)  (0) 2019.03.30
Druid 정리(2)  (0) 2019.03.30
Druid 정리(1)  (1) 2019.03.30