hive sql 예제

y는 테이블 생성 시간에 지정된 대로 해당 테이블의 버킷 수의 다중 또는 제수여야 합니다. 선택한 버킷은 bucket_number 모듈 y가 x와 같은지 결정됩니다. 따라서 위의 예제에서 다음 테이블 샘플 절 다음 명령은 “/user/hive/warehouse/retail.db” 위치에 있는 테이블을 만듭니다. 하나의 삽입 문에 있습니다. 여러 파티션에 로드하려면 아래 그림과 같이 다중 삽입 문을 사용해야 합니다. 사용자는 Hive 언어로 기본적으로 지원되는 기능을 사용하여 데이터 스트림에서 사용자 지정 매퍼 및 감속기를 연결할 수도 있습니다. 예를 들어 사용자 지정 매퍼 스크립트(map_script)와 사용자 지정 감속기 스크립트를 실행하기 위해 reduce_script – 사용자는 TRANSFORM 절을 사용하여 매퍼 및 감속기 스크립트를 포함하는 다음 명령을 실행할 수 있습니다. 예를 들어 어퍼(`fOoBaR`) 결과와 같은 A의 모든 문자를 대문자로 변환하여 생성된 문자열을 반환하여 `FOOBAR` 직렬화기를 생성하고, Deserializer는 레코드를 처리하는 방법에 대한 하이브에 대한 지침을 제공합니다. 다음 예제에서는 시스템의 몇 가지 중요한 기능을 강조 표시합니다. 자세한 쿼리 테스트 사례 집합은 Hive 쿼리 테스트 사례에서 찾을 수 있으며 해당 결과는 쿼리 테스트 사례 결과에서 찾을 수 있습니다. 또한 데이터 집합에 대해 효율적인 샘플링 쿼리를 실행할 수 있도록 특정 열에서 테이블을 버킷하는 것이 좋습니다. 버킷링이 없는 경우 테이블에서 임의 샘플링을 수행할 수 있지만 쿼리가 모든 데이터를 검색해야 하므로 효율적이지 않습니다. 다음 예제에서는 userid 열에서 버킷된 page_view 테이블의 경우를 보여 줍니다: Java 정규식 구문(Java 정규식 구문 참조)과 일치하는 B의 모든 하위 문자열을 C와 대체하여 생성된 문자열을 반환합니다.

예를 들어 regexp_replace(`foobar`, `oo|ar`, )는 `fb`를 반환하여 다른 테이블에 키가 있는지 확인하기 위해 다음 예제와 같이 LEFT SEMI JOIN을 사용할 수 있습니다. 위의 단계에서는 ID, 이름, 수수료, 도시 등 다양한 필드를 갖춘 데이터베이스 대학의 학생이라는 하이브 테이블을 만들었습니다. 테이블을 참조하는 모든 사람이 열의 의미에 대한 개요를 얻을 수 있도록 각 열에 대한 주석이 언급되었습니다. 이 문제는 하나의 매퍼가 임의의 행 세트를 취하고 구별 (dt, 국가) 쌍의 수가 hive.exec.max.dynamic.partitions.pernodes의 한계를 초과 할 가능성이 매우 높습니다. 한 가지 방법은 매퍼의 동적 파티션 열로 행을 그룹화하고 동적 파티션이 생성되는 감속기에 배포하는 것입니다. 이 경우 고유한 동적 파티션 수가 크게 줄어듭니다. 위의 예제 쿼리를 다시 작성할 수 있습니다: HiveQL 템플릿을 찾고 있는 경우 보물 데이터의 예제 쿼리 카탈로그 페이지를 방문합니다. 이러한 구조는 현재 프로그래밍 방식으로만 만들 수 있습니다.

カテゴリー: 未分類   パーマリンク

コメントは受け付けていません。