EPCVIP6 AWS Glue란? AWS Glue는 완전 관리형 ETL(추출, 변환, 로드) 서비스로, 효율적인 비용으로 간단하게 여러 데이터 스토어 간에 원하는 데이터를 분류, 정리, 보강, 이동합니다. AWS Glue를 사용하여 데이터 웨어하우스를 구축하여 데이터 포맷을 조직하고 정리하고 인증합니다. AWS 클라우드 데이터를 데이터 스토어로 변환하고 이동할 수 있습니다. AWS Glue는 데이터 웨어하우스를 구축할 때 많은 작업을 단순화합니다. 중앙 카탈로그의 데이터 스토어에 대한 메타데이터를 발견하고 분류합니다. 클릭스트림 혹은 프로세스 로그와 같이 반정형 데이터를 실행할 수 있습니다. 예약된 크롤러 프로그램의 테이블 정의로 AWS Glue 데이터 카탈로그를 채웁니다. 크롤러는 분류자 로직을 호출하여 데이터의 스키마, 포맷 및 데이.. 2019. 9. 28. Apache Spark(아파치 스파크) RDD API 보호되어 있는 글 입니다. 2019. 9. 26. Apache Spark(아파치 스파크) Intro 보호되어 있는 글 입니다. 2019. 9. 26. BigQuery와 Datalab을 사용해 데이터 분석하기 보호되어 있는 글 입니다. 2019. 9. 26. Apache SparkSQL과 Dataframe 보호되어 있는 글 입니다. 2019. 9. 26. 대용량 데이터 처리 기술(GFS, HDFS, MapReduce, Spark) 보호되어 있는 글 입니다. 2019. 9. 26. 이전 1 다음