데이터베이스 제안의 힘 : 데이터 카탈로그가 분석가에게 힘을 실어주는 방법

제안의 힘 : 데이터 카탈로그가 분석가에게 힘을 실어주는 방법

Anonim

작성자 : Techopedia Staff, 2016 년 6 월 22 일

테이크 아웃 : 호스트 Rebecca Jozwiak가 Dez Blanchfield, Robin Bloor 및 David Crawford와 데이터 카탈로그의 장점에 대해 설명합니다.

비디오를 보려면이 이벤트에 등록해야합니다. 비디오를 보려면 등록하십시오.

Rebecca Jozwiak : 신사 숙녀 여러분 안녕하세요, 2016 년 Hot Technologies에 오신 것을 환영합니다. 오늘 우리는“제안의 힘 : 데이터 카탈로그가 분석가에게 힘을 실어주는 방법”을 얻었습니다. 저는 호스트 인 Rebecca Jozwiak입니다. 카바나 흐는 오늘 세계를 여행하는 동안 우리와 함께 해 주셔서 감사합니다. 올해는 덥습니다. 텍사스의 내가있는 곳은 덥지 않고 온통 뜨겁습니다. 모든 종류의 신기술이 폭발적으로 폭발하고 있습니다. 우리는 IoT, 스트리밍 데이터, 클라우드 채택을 보유하고 있으며 Hadoop은 계속 성숙하고 채택되고 있습니다. 우리는 자동화, 머신 러닝을 가지고 있으며이 모든 것은 물론 데이터에 밑줄을 긋습니다. 그리고 오늘날 기업들은 점점 더 많은 데이터를 주도하고 있습니다. 물론 그 점은 지식과 발견으로 이어지고 더 나은 결정을 내리는 것입니다. 그러나 실제로 데이터에서 최대한의 가치를 얻으려면 쉽게 얻을 수 있어야합니다. 기업 내부의 몇몇 사람들의 두뇌에 잠겨 있거나 묻히거나, 또는 두뇌 속에 있으면 기업 전체에 큰 도움이되지 않을 것입니다.

그리고 데이터 카탈로그와 라이브러리 과정에 대해 생각하고있었습니다. 오래 전에 그곳에서 무언가를 찾아야 할 경우, 주제를 연구하거나 정보를 찾아야하는 경우 도서관으로갔습니다. 물론 카드 카탈로그 나 그곳에서 일한 게비 아가씨에게갔습니다. 그러나 방황하는 것도 재미있었습니다.보고 싶었다면 깔끔한 것을 발견했을 수도 있습니다. 모르는 흥미로운 사실을 발견 할 수 있지만 실제로 무언가를 찾아야한다면, 그리고 당신은 당신이 찾고있는 것을 알았고, 당신은 카드 카탈로그가 필요합니다. 물론 엔터프라이즈 급은 데이터 카탈로그입니다.이 카탈로그는 사용자가 풍부하고, 발견하고, 공유하고, 소비하고 실제로 도울 수 있도록 모든 데이터를 밝게 비출 수 있습니다 사람들은 더 빠르고 쉽게 데이터를 얻을 수 있습니다.

오늘 우리는 데이터 과학자 인 Dez Blanchfield를 얻었고, 수석 분석가 인 Robin Bloor 박사도 Alation에서 데이비드 크로포드 (David Crawford)를 데려갔습니다. 우리는 Dez와 함께 할 것입니다. 데즈, 나는 당신에게 공을 전달하고 바닥은 당신입니다.

Dez Blanchfield : 감사합니다. 오늘 저를 주셔서 감사합니다. 이것은 제가 매일 관심을 갖고있는 거의 모든 조직에서 프리 쇼 밴터에서 아주 간략하게 언급 한 것과 동일한 문제를 발견하기 때문에 매우 관심이있는 문제입니다. 몇 년 이상 사업을 해 온 대부분의 조직은 조직에 다양한 데이터가 묻혀 있으며 다른 형식을 가지고 있으며 실제로 Lotus Notes로 돌아가는 데이터 세트가있는 클라이언트가 있습니다. 의사 인터넷으로서의 사례, 그리고 그들 모두는 실제로 데이터의 위치와 접근 방법, 접근 방법, 접근시기, 접근 방법에 대한이 도전에 직면하고 있습니다. 카탈로그, 모든 사람이 이용할 수있는 장소로 가져가는 방법 : A) 무엇이 있는지, 무엇이 들어 있는지 알고, B), 그것에 접근하고 사용하는 방법. 물론 가장 큰 과제 중 하나는 문제를 찾는 것입니다. 다른 큰 과제는 무엇이 있는지, 어떻게 액세스하는지 아는 것입니다.

나는 수십 개의 데이터베이스를 가지고 있다는 것을 잘 알고 있지만 실제로 거기에 무엇이 있는지, 무엇이 있는지 알아내는 방법을 알지 못합니다. 프리 쇼 데이터에서 지금 발견하는 것처럼 변하지 않습니다. 사무실을 돌아 다니면서 질문을하고, 입방체 벽을 가로 질러 소리를 지르고 시도하고, 종종 내 경험은, 당신은 심지어 프런트 데스크, 리셉션, 방황하는 사람을 알고 누군가를 알고 있는지 물어볼 수 있습니다 당신은 대화를 갈 것입니다. 누군가가 방금 만들었 기 때문에 데이터 세트를 알지 못하기 때문에 항상 IT 전문가가되는 것은 아니며, IT 환경에 존재하는 일종의 프로젝트를 발견 할 수도 있습니다. 프로젝트 관리자는 모든 것의 스프레드 시트를 사용했으며 자산과 컨텍스트 및 이름에 관한 엄청난 양의 중요한 정보를 얻었습니다. 프로젝트를 알고 그 사람을 알지 못하면 해당 정보를 찾을 수 없습니다. 사용할 수 없으며 원본 파일을 가져와야합니다.

데이터와 관련하여 혼란스러워하는 문구가 있는데 반드시 동의하지는 않지만, 약간의 유쾌한 생각이라고 생각합니다. 즉, 일정량의 사람들은 데이터가 새로운 석유라고 생각합니다. 오늘 나중에도 몇 가지 측면에서 그 내용을 다룰 것입니다. 그러나 내가 분명히 주목 한 것은, 그러한 변화의 일환으로, 데이터를 가치있게 평가하는 법을 배운 비즈니스 조직이 경쟁사보다 훨씬 유리하다는 점입니다.

약 5-6 년 전에 IBM의 흥미로운 논문이 있었으며 호주에서 약 4, 000 개의 회사를 조사했으며 모든 정보, 모든 성능 데이터, 모든 재무 데이터를 가져와 끓는 냄비에 넣었습니다. 그것을 호주 경제 대학에 보냈는데, 그들은 실제로 여기에서 일반적인 추세를 시작했습니다. 그리고 그것은 기술을 활용 한 회사들이 경쟁자들이 거의 따라 올 수없는 동료들과 경쟁사들에 비해 항상 경쟁 우위를 얻었고, 저는 생각합니다. 우리가 사람들이 가지고있는 데이터를 찾고, 데이터를 사용 가능하게하고, 아주 쉽게 소모품으로 사용할 수있게하는 방법을 명확하게 파악한 조직에서 사람들이 디지털 혁신이라고 부르는 것을 본 데이터의 경우가 매우 그렇습니다. 조직에 필요한 이유를 항상 알 필요없이 항상 조직에 패션을 제공하고 경쟁사에 비해 상당한 이점을 얻습니다.

이 슬라이드에는 몇 가지 예가 있습니다. 내 생각에 거의 모든 산업 부문에서 대규모의 혼란이 데이터에 의해 주도되고 있으며 현재 추세가 진행되어야 할 경우 내 견해는 오랜 브랜드가 마침내 이것이 의미하는 바에 도달하여 게임에 진입 할 때, 그들은 도매로 게임에 들어갈 것이기 때문에 시작되었습니다. 많은 데이터를 보유한 주요 소매 업체가 데이터에 대한 과거 분석을 적용하기 시작했을 때 데이터가 존재한다는 사실을 알고 있으면 일부 온라인 플레이어가 약간의 모닝콜을 받게됩니다.

그러나 이러한 브랜드의 대부분을 통해 세계에서 가장 큰 택시 회사 인 Uber가 있습니다. 그들은 택시를 소유하고 있지 않기 때문에 무엇이 마술인지, 데이터는 무엇입니까? 가장 큰 숙박 시설 제공 업체 인 에어 비앤비에는 세계에서 가장 큰 전화 회사 인 WeChat이 있지만 실제 인프라와 송수화기, 전화선이 없습니다. 전 세계에서 가장 큰 소매업 체인 Alibaba는 재고를 보유하고 있지 않습니다. 페이스 북, 가장 큰 미디어 회사. 마지막으로 지금은 14 억 명의 활성 데이터 사용자가 있다고 생각합니다. 근처에 있지는 않습니다. 누군가 지구의 1/4이 실제로 매일 거기에 있다고 주장하지만 실제로는 콘텐츠를 만들지 않는 콘텐츠 제공 업체가 있습니다. 제공하는 모든 데이터는 해당 콘텐츠에 의해 만들어지지 않습니다. 구독자에 의해 우리는 모두이 모델을 알고 있습니다.

당신이 듣거나 듣지 못한 SocietyOne은 로컬 브랜드입니다. 몇몇 국가에서는 실제로 P2P 대출을 수행하는 은행이라고 생각합니다. 즉, 돈이 없습니다. 트랜잭션을 관리하고 그 아래에 데이터를 저장하기 만하면됩니다. 넷플릭스, 우리는 모두 매우 익숙합니다. 여기에 흥미로운 한 줄짜리가 있습니다. Netflix가 호주에서 합법적으로 사용될 수 있었을 때 공식적으로 발표되었을 때 VPN을 사용할 필요가 없었습니다. 전 세계 많은 사람들이 귀하의 지역에서 VPN을 이용할 수없는 경우가 많습니다. – Netfix가 호주에서 출시 될 때 인터넷 링크의 국제 대역폭이 40 % 증가하여 밤새 호주의 인터넷 사용량은 데이터를 사용하는 클라우드 호스팅 응용 프로그램 하나만으로 거의 두 배가되었습니다. 그것은 단지 마음을 흔들리는 통계입니다.

물론 우리는 모두 애플과 구글에 친숙하지만, 세계에서 가장 큰 소프트웨어 기업이지만 실제로 앱을 작성하지는 않습니다. 이 모든 조직과 일관된 것은 무엇입니까? 글쎄, 그것은 데이터이며 데이터의 위치를 ​​알지 못했고 카탈로그를 작성하는 방법을 알지 못했기 때문에 거기에 도달하지 못했습니다.

우리가 지금 찾고있는 것은 데이터라고하는 완전히 새로운 자산 클래스가 있고 회사가 깨어나고 있다는 것입니다. 그러나 그들은 항상 모든 데이터를 매핑하고 모든 데이터를 카탈로그 화하여 사용 가능하게 만드는 도구와 노하우 및 그 방법을 가지고 있지는 않지만, 물리적 자산이 거의없는 회사는 시장 가치가 높은 것으로 나타났습니다. 이 새로운 데이터 자산 클래스를 통해 시간을 기록하십시오. 내가 말했듯이, 오래된 플레이어 중 일부는 이제 깨어나 확실히 그것을 가지고 있습니다.

나는 여정을 조금만 여행하는 사람들의 열렬한 팬입니다. 그래서 18 백에서 1800 년대 후반에 미국 시장에서 이것에 대해 더 많이 알게 될 것입니다. 매년 약 10 년마다 그 시점에서 그것들을 운영했다고 생각하지만, 매년 인구 조사를한다면 실제로 데이터 분석을하는 데 최대 8 년에서 9 년이 걸릴 수 있습니다. 그 데이터 세트는 종이에있는 상자에 남아 있었고 거의 아무도 그것을 찾을 수 없었습니다. 그들은이 보고서를 계속 펌핑했지만 실제 데이터를 얻기가 매우 어려웠으며, 1940 년대 2 차 세계 대전과 함께 또 다른 중요한 순간과 비슷한 상황을 겪었으며 Bletchley Park Bombe는 BOMBE라는 철자를 사용했습니다. 작은 데이터 세트를 통해 신호를 찾아 Enigma를 통해 코드를 해독하는 데 사용되는 엄청난 수의 분석 도구였습니다.

다시 말하지만 본질적으로 데이터를 카탈로그 화하지는 않지만 데이터에 태그를 지정하고 매핑하고 데이터 세트 내에서 패턴을 찾아서 찾을 수있게하는 장치입니다.이 경우 코드를 구분하고 키와 구를 찾아서 찾을 수 있습니다. 데이터 세트에서 정기적으로 데이터를 검색하므로 데이터에서 사물을 찾고 데이터 카탈로그 화로 이어지는 여정을 거쳤습니다.

그리고 이런 것들이 등장했습니다.이 거대한 저비용 랙 머신은 바로 기성품 머신입니다. 그리고 우리는 매우 흥미로운 일을했습니다. 그리고 그들과 함께 한 일 중 하나는 지구를 색인 할 수있는 매우 저렴한 비용의 클러스터, 그리고 매우 유명해진 유명 브랜드이지만 Google의 가장 일반적인 집입니다. 우리 모두가 들어 본 브랜드 – 실제 동사가되고 브랜드가 동사가되면 성공한다는 것을 알게됩니다. 그러나 Google이 비즈니스 세계에서 실현하지 못한 채 지구 전체를 특정 수준으로 색인화하고 전 세계의 데이터를 카탈로그 화하여 매우 쉽게 사용할 수 있다는 점에서 작은 한 줄짜리 수식으로 된 편리한 양식, 거의 아무것도 포함하지 않는 웹 페이지, 쿼리를 입력하면 이미 행성을 크롤링하고 색인을 생성하고 쉽게 사용할 수 있기 때문에 찾아서 찾습니다.

그리고 우리가 알아 차린 것은“글쎄요, 우리는 조직에서 이것을하지 않습니다. 왜 그런가요? 왜 지구 전체를 매핑하고 색인을 생성하고, 크롤링하고 색인을 생성하고, 사용 가능하게 만들고, 검색 한 다음, 찾을 대상을 클릭하여 어떻게 찾을 수있는 조직이 필요한가? 내부적으로하지 않았습니까?”이제 인트라넷을 위해 물건을 찾거나 찾을 수있는이 세상에는이 작은 기계 랙이 많이 있지만 여전히 전통적인 웹을 뛰어 넘는 아이디어에 사로 잡히고 있습니다. 페이지 또는 파일 서버.

이제이 차세대 데이터 카탈로그에 여러 가지 방법으로 들어가는 대신 포스트잇 메모 및 워터 쿨러 대화를 통해 데이터 액세스를 발견하는 것이 더 이상 데이터 검색 및 카탈로그에 적합한 방법이 아니며 실제로는 생각하지 않습니다. 정말이었다. 우리는 더 이상 메모를 전달하고 메모를 게시하고 채팅하는 사람들에게 그 모든 도전을 이끌 수 없습니다. 우리는 데이터 카탈로그 화에 대한이 차세대 접근 방식이 등장한 영역을 뛰어 넘고 있습니다. 우리는 팔을 그 주위에 두어야합니다. 이것이 쉬운 문제라면 이미 여러 가지 방법으로 문제를 해결했을 것이지만, 쉬운 문제는 아니라고 생각합니다. 데이터를 색인화하고 호출하는 것은 데이터의 내용을 알고 우리가 발견 한 내용에 대한 메타 데이터를 구축 한 다음, 특히 셀프 서비스 및 분석에 사용하기 쉬운 소모품 형태로 제공합니다. 여전히 해결해야 할 문제이지만 5 년 동안 퍼즐의 많은 부분이 잘 해결되고 사용 가능합니다.

아시다시피, 데이터를 분류하는 인간은 데이터 처리에서 다루는 가장 큰 악몽 중 하나이기 때문에 데이터를 분류하는 것은 실패의 레시피이며, 제 생각에 종이 양식을 작성하는 사람은 아마도 가장 악몽 인이 주제에 대해 정기적으로 이야기합니다. 우리는 빅 데이터 및 분석을 다루고, 날짜와 필드와 같은 간단한 것, 잘못된 형식으로 사람들이하는 일까지 지속적으로 수정해야합니다.

그러나 내가 말했듯이, 인터넷 검색 엔진이 매일 전 세계에서 색인을 생성하는 것을 보았으므로 이제는 검색 프로세스에서 비즈니스 데이터 세트에서 수행 할 수 있으며 도구 및 시스템이 현재 가능하다는 아이디어를 얻었습니다. 오늘 배우려고 할 때 쉽게 이용할 수 있습니다. 실제로 제 생각에는 트릭은 작업에 가장 적합한 도구 인 올바른 도구를 선택하는 것입니다. 그리고 그보다 더 적절하게, 이 경로를 시작하는 데 도움이되는 올바른 부분을 찾으십시오. 우리는 오늘 그것에 대해 듣게 될 것이라고 믿지만, 그렇게하기 전에 저는 대학 인 Robin Bloor로 가서 그의 주제에 대한 그의 이야기를들을 것입니다. 로빈, 너에게 넘겨 줄 수있어?

로빈 블로어 : 네, 물론 가능합니다. 이것이 작동하는지 봅시다, 그렇습니다. 좋아, 나는 Dez와는 다른 방향에서 왔지만, 같은 곳에서 끝날 것이다. 이것은 데이터 연결에 관한 것이므로 데이터에 실제로 연결하는 방법을 단계별로 살펴 보았습니다.

데이터가 그 어느 때보 다 단편화되었다는 사실이 있습니다. 데이터의 양이 엄청나게 증가하고 있지만 실제로는 서로 다른 데이터 소스도 놀라운 속도로 증가하고 있으므로 데이터는 항상 조각화되고 있습니다. 그러나 특히 분석 응용 프로그램 때문에 이러한 응용 프로그램이 유일한 응용 프로그램은 아닙니다. 우리는이 모든 데이터에 연결해야 할 충분한 이유를 얻었으므로 어려운 장소에 갇혀 있으며 조각난 데이터의 세계에 갇혀 있습니다. 데즈가 새로운 석유라고 부르면서 데이터에 기회가 있습니다.

데이터에 관해서는 파일 시스템이나 데이터베이스에서 회전하는 디스크에 살았습니다. 이제는 훨씬 더 다양한 환경에, 파일 시스템에 있지만, 현재 Hadoop 인스턴스 또는 Spark 인스턴스에도 있습니다. 여러 종류의 데이터베이스에 있습니다. 얼마 전까지 만해도 관계형 데이터베이스를 표준화했습니다. 문서 데이터베이스가 필요하고 그래프 데이터베이스가 필요하기 때문에 지난 5 년 동안 창을 열었습니다. 변경되었습니다. 따라서 회전하는 디스크에서 살았지만 이제는 SSD에서 살았습니다. 최신 SSD의 양 – 확실히 최신 SSD 장치는 삼성에서 나옵니다 – 20 기가 바이트 – 이것은 엄청납니다. 이제 데이터의 주요 사본이 디스크가 아닌 메모리에있을 수 있다는 점에서 메모리에 있습니다. 우리는 그런 시스템을 구축하는 데 사용하지 않았습니다. 우리는 지금한다. 그리고 그것은 구름 속에 산다. 즉, 클라우드에서 이러한 것들 중 하나에 살 수 있음을 의미합니다. 클라우드에서 클라우드의 위치를 ​​반드시 알 필요는 없으며 주소 만 있습니다.

하둡은 지금까지 확장 가능한 데이터 저장소로 실패했다. 우리는 확장 가능한 스케일 아웃 데이터 저장소가되기를 바랐으며 모든 것을위한 하나의 파일 시스템이 될 것입니다. 무지개는 하늘에 기본적으로 나타나고 유니콘은 춤을 추며 그 어느 것도 일어나지 않았습니다. 즉, 데이터 전송 문제가 발생하고 데이터 전송이 필요하지 않지만 때로는 어려움도 있습니다. 수 테라 바이트의 데이터를 가져 와서 데이터를 집어 던지고 던지거나 네트워크에 대기 시간이 나타나거나 다양한 장소에 나타나게되면 데이터는 오늘날 중력을 가지고 있습니다. 데이터를 전송하려는 경우 타이밍이 중요합니다. 요즘에는 항상 한 장소에서 다른 장소로 하나의 데이터를 가져 오는 데 걸리는 시간에 대한 제한이 거의 있습니다. 예전에는 기계가 유휴 상태 일 때 배치 창으로 생각했던 적이 있었으며 데이터의 양에 관계없이 그냥 버릴 수 있었고 모든 것이 잘 작동했습니다. 우리는 훨씬 더 실시간 세계에 살고 있습니다. 따라서 타이밍이 중요합니다. 데이터를 이동하려는 즉시 데이터에 중력이 있으면 이동할 수 없습니다.

데이터 관리는 실제로이 모든 데이터를 관리해야한다는 의미에서 무료로 얻을 수 없으며 실제로 필요한 작업을 수행하기 위해 데이터를 가져 오려면 복제가 필요할 수 있습니다. 당신이 그것을 어디에 두었을 수도 있습니다. 정상적인 데이터 처리를 수행하기에 충분한 자원이 없을 수 있습니다. 따라서 데이터가 복제되고 데이터가 생각보다 많이 복제됩니다. 누군가 오래 전에 나에게 평균 데이터 조각이 적어도 2.5 배 복제되었다고 말했습니다. ESB 또는 Kafka는 데이터 흐름에 대한 옵션을 제공하지만 오늘날에는 아키텍처가 필요합니다. 요즘에는 실제로 데이터를 던지는 것이 무엇을 의미하는지에 대해 어떤 식 으로든 생각해야합니다. 따라서 데이터를 실제로 액세스 할 때 필요한 성능을 얻을 수 있고 상황에 따라 달라지는 한 데이터에 액세스하는 것이 좋습니다. 어쨌든 어려운 상황입니다. 데이터 쿼리의 관점에서, 우리는 SQL의 관점에서 생각할 수있었습니다. 우리는 이제 다른 쿼리의 형태, SQL을 알고 있습니다. 그러나 인접한, 또한 그래프 쿼리입니다. Spark는 하나의 예일뿐입니다. 그래프 검색은 텍스트 검색, 이전보다 더 많이 수행해야하기 때문에 정규 표현식 유형의 검색, 패턴에 대한 복잡한 검색 및 실제 패턴 일치 등이 실제로 발생합니다. 그리고 그들은 당신이 찾고있는 것을 얻거나 당신이 찾고있는 것을 얻을 수 있기 때문에 모두 유용합니다.

요즘 쿼리는 여러 데이터에 걸쳐 있으므로 항상 그렇게하는 것은 아니며, 그렇게하면 성능이 저하되는 경우가 많습니다. 따라서 상황에 따라 다르지만 사람들은 여러 데이터 소스에서 데이터를 쿼리 할 수 ​​있기를 기대하므로 한 종류 이상의 데이터 연합이 점점 더 최신 화되고 있습니다. 성능에 따라 다른 방식으로 수행하는 데이터 가상화도 매우 일반적입니다. 데이터 쿼리는 실제로 전체 프로세스가 아닌 프로세스의 일부입니다. 실제로 분석 성능을보고있는 경우 상황에 따라 실제 분석에 소요되는 시간이 데이터 수집보다 훨씬 오래 걸릴 수 있지만, 원하는 경우 데이터 쿼리는 절대적으로 필요합니다. 여러 데이터 소스에 대한 분석이 필요합니다. 실제로는 실제로 확장 가능한 기능이 있어야합니다.

카탈로그에 대해서는 카탈로그는 어떤 이유로 존재합니다. 최소한 우리는 디렉토리가 있고 데이터베이스에 스키마가 있으며 각 카탈로그가 있으며 어디를 가든 한 곳을 찾을 수 있고 실제로는 어떤 종류의 카탈로그가 있으며, 통합 된 글로벌 카탈로그는 분명히 좋은 아이디어입니다. 그러나 그런 회사는 거의 없습니다. 나는 이천 년-이천 공황-다시 공산주의자들은 그들이 가지고있는 실행 가능한 파일 수를 정할 수 없었으며, 얼마나 많은 다른 데이터 저장소가 있는지 신경 쓰지 않았으며, 아마도 지금은 그런 일임을 기억합니다. 알다시피, 대부분의 회사는 글로벌 의미에서 어떤 데이터를 가지고 있는지 적극적으로 알고 있지 않습니다. 그러나 실제로 글로벌 카탈로그를 보유해야하거나 데이터 소스의 증가와 지속적인 응용 프로그램 증가로 인해 발생하는 상황에 대한 글로벌 이미지를 확보하는 것이 점점 더 필요 해지고 있으며 특히 분석에 필요합니다. 한 가지 방법으로도 데이터 계보 및 문제와 같은 다른 문제가 있기 때문에 보안이 필요합니다. 데이터 거버넌스의 여러 측면, 필요한 데이터를 모를 경우 아이디어 당신이 그것을 지배 할 것이라는 것은 터무니없는 것입니다. 따라서 모든 데이터가 어떤 식 으로든 카탈로그 화되는 것은 사실 일뿐입니다. 문제는 카탈로그가 일관성이 있는지 여부와 실제로 카탈로그로 할 수있는 작업입니다. 그래서 저는 레베카로 돌아가겠습니다.

Rebecca Jozwiak : 알겠습니다, Robin. 다음으로 우리는 Alation에서 David Crawford를 얻었습니다. David 저는 공을 당신에게 넘겨주었습니다.

데이비드 크로포드 : 정말 감사합니다. 이 쇼에 참여 해주셔서 감사합니다. 나는 이것이 시작될 것이라고 생각한다. 그래서 나의 역할은, 그 이론의 일부를 취하여 그것이 실제로 어떻게 적용되는지, 그리고 우리가 실제 고객을 이끌어 낼 수있는 결과를 보는 것입니다. 슬라이드에서 몇 가지를 살펴보면, 분석적으로 개선 할 수있는 결과에 대해 이야기하고 싶습니다. 토론에 동기를 부여하기 위해 우리는 그들이 어떻게 거기에 도달했는지 이야기 할 것입니다. 저는 정말 똑똑한 많은 사람들과 이러한 고객들과 긴밀히 협력하게되어서 운이 좋으며, 실제로 측정 할 수있는 소수의 사람들을 지적하고 데이터 카탈로그가 분석가에게 어떤 영향을 미치는지 이야기하고 싶습니다. 워크 플로우. 그리고 간단히 설명하자면, 데이터 카탈로그와 이전의 중재 된 솔루션을 비교하면서 변화가 보이는 것 중 하나와 관계가 우리가 함께 구축 한 솔루션에 대해 실제로 생각하는 방식 중 하나는 분석가로부터 시작하는 것이라고 생각합니다. 거꾸로 작업하십시오. 말하자면, 분석가의 생산성 향상에 대해이 작업을하겠습니다. 컴플라이언스 또는 인벤토리를 보유하는 것이 아니라 분석가의 생산성을 높이는 도구를 만들고 있습니다.

금융 서비스 회사 스퀘어의 데이터 과학자와 대화 할 때, Nick이 한 사람이 있는데, 그의 방법에 대해 이야기 한 그는 보고서를 시작하기 위해 올바른 데이터 세트를 찾기 위해 몇 시간이 걸렸습니다. 시장 점유율에서 검색을 사용하여 단 몇 초 만에 검색을 수행 한 결과, Square를 사용하는 분석가를 끌어 내고 실례하고 Alation을 사용하는 분석가를 대상으로 CTO와 대화를 나 their습니다. 생산성 향상과 세계 최고의 소매 업체 중 하나 인 eBay는 정기적으로 SQL 분석을 수행하는 수천 명 이상의 직원을 보유하고 있으며 Deb Says와 밀접하게 협력하고 있습니다. 데이터 도구 팀의 관리자 인 그녀는 질의자가 Alation을 채택하고 카탈로그를 채택 할 때 데이터베이스에 대해 새 쿼리를 작성하는 속도가 두 배가되는 것을 발견했습니다.

이것이 실제 결과이며, 이들은 실제로 조직에 카탈로그를 적용하는 사람들이며, 설정하는 데 필요한 작업을 안내하고자합니다. 회사에서 카탈로그를 구축하는 방법과 가장 중요한 것은 자동으로 많은 일이 발생하기 때문에 Dez는 시스템에 대해 이야기하고 시스템에 대해 배우며 이것이 바로 현대 데이터 카탈로그가하는 일입니다. 따라서 데이터 센터에 Alation을 설치 한 다음 데이터 환경의 다양한 메타 데이터 소스에 연결합니다. 데이터베이스와 BI 도구에 중점을 둘 것입니다. 둘 다 기본적으로 존재하는 기술 메타 데이터를 추출 할 것입니다. 그렇다면 어떤 테이블입니까? 어떤 보고서? 보고서 정의 란 무엇입니까? 따라서 해당 기술 메타 데이터를 추출하고 해당 시스템 내부의 모든 개체에 대해 카탈로그 페이지가 자동으로 생성 된 다음 해당 기술 메타 데이터를 추출하여 사용 데이터 위에 계층화합니다. 이는 주로 데이터베이스에서 쿼리 로그를 읽음으로써 이루어지며, 이는 매우 흥미로운 정보 소스입니다. 따라서 분석가가 쿼리를 작성할 때마다, 보고 도구, 집에서 자라고 있는지 또는 선반에서, 대시 보드를 업데이트하기 위해보고 도구가 쿼리를 실행하는지 여부, 응용 프로그램에서 쿼리를 실행하여 데이터를 삽입 할 때 데이터 세트 –이 모든 것이 데이터베이스 쿼리 로그에 캡처됩니다. 카탈로그 유무에 관계없이 데이터베이스와 함께 쿼리 로그에 카탈로그가 캡처됩니다. 데이터 카탈로그가 수행 할 수있는 작업, 특히 Alation의 카탈로그가 수행 할 수있는 작업은 해당 로그를 읽고, 내부 쿼리를 요청하고, 해당 로그를 기반으로 실제로 흥미로운 사용량 그래프를 생성하여 향후 사용자에게 알리기 위해 사용합니다. 과거 데이터 사용자가 사용한 데이터에 대한

그래서 우리는 모든 지식을 하나의 카탈로그로 가져오고, 이것을 실제로 구현하기 위해 이미 고객에게 배포 된 통합입니다. 따라서 Oracle, Teradata, Redshift, Vertica 및 기타 여러 가지를 보았습니다. 관계형 데이터베이스. Hadoop 세계에는 Hadoop 파일 시스템, Impala, Tez, Presto 및 Hive 위에 Hadoop에 대한 다양한 SQL, 관계형 메타 저장소가 있으며 Altiscale과 같은 클라우드 Hadoop 개인 공급자도 성공했습니다. 또한 Tableau Server, MicroStrategy 서버에 연결하고 대시 보드를 색인화하고 Plotly와 같은 데이터 과학 차트 도구와 통합 할 수있었습니다.

우리는이 모든 시스템에 연결하고, 이 시스템을 고객에게 연결하고, 기술 메타 데이터를 가져 왔으며, 사용 데이터를 가져 왔으며, 데이터 카탈로그를 자동으로 프라이밍했습니다. 지식을 중앙 집중화하지만 데이터 카탈로그로 사물을 중앙 집중화한다고해서 eBay, Square 및 시장 점유율에서 우리가 이야기했던 놀라운 생산성 향상을 제공하지는 않습니다. 그러기 위해서는 실제로 분석가에게 지식을 전달하는 방식을 바꿔야합니다. 이를 준비하기 위해 묻고있는 질문 중 하나는 "카탈로그가 실제로 분석가의 워크 플로에 어떤 영향을 줍니까?"였습니다.

그것이 우리가 하루 종일 생각하는 것에 대한 것이며, 생각의 변화에 ​​대해 이야기하기 위해, 풀 모델에 대한 푸시 구절에 대해 이야기하기 위해, 나는 Kindle에서 읽은 전후에 세계가 어떻게 생겼는지에 대해 빠른 비유를 원했습니다. 실제 책을 읽을 때 단어를 발견했을 때 단어의 정의를 잘 알지 못하고 문맥에서 추측 할 수 있습니다. 소파에서 일어나 책장으로 걸어 가서 사전을 찾아서 먼지를 털어 내고 알파벳 순서의 단어 목록에서 올바른 위치로 뒤집어 놓을 것입니다. 그것의 뉘앙스. 실제로 일어나지 않습니다. 그래서 Kindle 앱을 구입하면 거기에서 책을 읽기 시작하고, 확실하지 않은 단어가 표시되고 단어를 터치합니다. 같은 화면에서 갑자기 모든 단어의 뉘앙스와 사용 예가 다른 단어의 사전 정의이며 약간 살짝 밀면 해당 주제에 대한 Wikipedia 기사가 표시됩니다. 다른 언어 나 다른 언어로 번역 할 수있는 번역 도구를 얻습니다. 갑자기 그 언어에 대한 지식이 훨씬 풍부 해져서 갈 때와 비교했을 때 엄청난 횟수로 발생합니다. 그 자료를 직접 가져 오십시오.

그리고 제가 논의하고자하는 것은 분석가의 워크 플로와 분석가가 데이터 문서를 다루는 방식은 실제로 독자가 사전과 상호 작용하는 방식, 물리적 인 것, 또는 Kindle과 우리가 실제로 생산성 향상을 본 방식은 카탈로그를 유출하지 않고 분석가의 워크 플로에 연결하는 것이므로 여기에서 데모를 해달라고 요청했습니다. 이 프레젠테이션의 초점을 맞추겠습니다. 그러나 데모의 컨텍스트를 설정하고 싶습니다. 사용자가 필요할 때 데이터 지식을 사용자에게 제공하는 것에 대해 생각할 때 적절한 시간, 시간을 보내는 장소 및 분석을 수행하는 장소는 SQL 쿼리 도구라고 생각합니다. SQL 쿼리를 작성하고 실행하는 장소입니다. 그래서 우리는 하나를 만들고 그것을 만들었고 다른 쿼리 도구와 다른 점은 데이터 카탈로그와의 긴밀한 통합입니다.

우리의 쿼리 도구는 Alation Compose입니다. 웹 기반 쿼리 도구이며 잠시 후에 보여 드리겠습니다. 이전 슬라이드에서 보았던 모든 데이터베이스 로고에서 작동하는 웹 기반 쿼리 도구입니다. 특히 시연하려고하는 것은 카탈로그 정보가 사용자에게 오는 방식입니다. 그리고이 세 가지 다른 방식으로 진행됩니다. 그것은 중재를 통해 이루어지며, 데이터 거버너, 데이터 관리자 또는 어떤 방식 으로든 관리자 또는 관리자 인 누군가가“노트 또는 경고 메시지를 표시하고 싶습니다. 워크 플로를 통해 적절한시기에 사용자에게 제공되는지 확인하십시오.”이것이 바로 개입이며이를 보여 드리겠습니다.

스마트 제안은 도구가 카탈로그에 대한 모든 집계 된 지식을 사용하여 작성하는 동안 쿼리의 개체 및 부분을 제안하는 방법입니다. 알아야 할 가장 중요한 점은 실제로 쿼리 로그를 활용하여 사용을 기반으로 제안하고 이전에 작성된 쿼리의 일부를 찾는 것입니다. 그리고 우리는 그것을 보여줄 것입니다.

그리고 미리보기. 미리보기는 객체의 이름을 입력 할 때 카탈로그가 알고있는 모든 것 또는 카탈로그가 해당 객체에 대해 알고있는 가장 관련성이 높은 것을 보여줍니다. 따라서 이전에 사용했던 데이터 샘플, 해당 객체의 논리적 이름 및 설명은 요청하지 않아도 데이터를 작성하는 동안 제공됩니다.

더 이상 이야기하지 않으면 데모를 볼 수 있으며 데모가 나타날 때까지 기다릴 것입니다. 여기서 보여 드리는 것은 검색어 도구입니다. 전용 SQL 작성 인터페이스입니다. 특정 의미에서 카탈로그와 별도의 인터페이스입니다. Dez와 Robin은 카탈로그에 대해 이야기했으며 카탈로그 인터페이스를 통해 워크 플로를 서비스하기 위해 카탈로그 인터페이스를 직접 가져 오는 방법에 대해 조금 이야기하고 있습니다.

여기에 SQL을 입력 할 수있는 장소를 보여 드리고 있으며 맨 아래에는 참조하는 객체에 대한 정보가 표시되어 있습니다. 이제 검색어 입력을 시작하겠습니다. 이러한 개입 중 하나에 도달하면 중단하겠습니다. “select”를 입력하고 연도를 원합니다. 나는 이름을 원한다. 그리고 나는 급여 데이터를 찾아 볼 것입니다. 이것이 교육 데이터 세트입니다. 그것은 고등 교육 기관에 대한 정보를 가지고 있으며, 나는이 표 중 하나에있는 평균 교수 급여를보고 있습니다.

그래서 저는 실제로“급여”라는 단어를 입력했습니다. 그것은 열의 이름과 정확히 일치하지 않습니다. 논리적 메타 데이터와 물리적 메타 데이터를 모두 사용하여 제안을합니다. 그리고 제가 여기서 지적하고자하는 것은 여기에 나타나는 노란색 상자입니다. 이 열에 경고가 있습니다. 나는 그것을 찾지 않고이 데이터를 올바르게 사용하는 방법에 대한 수업을 들지 않았습니다. 그것은 나에게 왔으며, 이 데이터와 관련된 기밀 유지 계약에 관한 경고가되었습니다. 따라서 공개 규칙이 있습니다. 이 데이터를 쿼리 할 경우이 테이블에서 데이터를 가져 오려고합니다. 공개 방법에주의해야합니다. 여기 거버넌스 정책이 있습니다. 데이터를보고있는 시점에 대해 알고있을 때이 정책을 훨씬 쉽게 준수 할 수 있도록하는 몇 가지 준수 문제가 있습니다.

그래서 저에게 그런 생각이 들었습니다. 그리고 수업료도 볼 것입니다. 여기에서 미리보기가 시작됩니다. 이 수업료 열에는 기관 테이블에 수업료 열이 있고 그 프로필을보고 있습니다. Alation은 테이블에서 샘플 데이터를 가져 와서 가져옵니다.이 경우 꽤 흥미로운 것을 보여줍니다. 그것은 값의 분포를 보여 주며, 0 값은 샘플에서 45 번 나타 났으며 다른 값보다 더 많이 나왔다는 것을 보여줍니다. 따라서 일부 데이터가 누락되었을 수 있습니다.

고급 분석가 인 경우 이미 워크 플로의 일부일 수 있습니다. 특히 내가 특히 세심한 사람이라면 미리 프로파일 링 쿼리를 많이 할 것입니다. 새로운 데이터에 접근 할 때마다 항상 데이터 범위가 무엇인지 생각합니다. 그러나 데이터 분석을 처음 사용하는 경우이 데이터 세트를 처음 사용하는 경우 열이 있으면 항상 채워져 있다고 가정 할 수 있습니다. 또는 채워지지 않으면 0이 아니거나 null이거나 그와 비슷한 것으로 가정 할 수 있습니다. 그러나이 경우 우리는 많은 영점을 가지고 있으며 평균을 사용하면 데이터가 누락 된 것이 아니라 실제로 0이 있다고 가정하면 아마도 잘못되었을 것입니다.

그러나 Alation은이 미리보기를 워크 플로에 가져 와서이 정보를 살펴보고 초보 분석가에게 해당 데이터에 대해 알아볼 사항이 있는지 확인할 수있는 기회를 제공합니다. 미리보기가 있습니다.

다음으로해야 할 일은이 정보를 얻을 수있는 테이블을 찾아 보는 것입니다. 그래서 우리는 현명한 제안을 봅니다. 그것은 항상 가고 있었지만 특히 여기에 아무것도 입력하지 않았지만이 쿼리에 사용하려는 테이블을 제안 할 것입니다. 그리고 이것에 대해 알아야 할 가장 중요한 것은 사용 통계를 활용한다는 것입니다. 예를 들어, eBay와 같은 환경에서 단일 데이터베이스에 수십만 개의 테이블이 있고, 겨에서 밀을 칠 수있는 도구를 사용하고 이러한 통계를 사용하는 것이 실제로 중요합니다. 뭔가 가치있는 제안.

이 표를 제안하겠습니다. 미리보기를 볼 때 실제로 쿼리에서 이미 언급 한 세 개의 열을 강조 표시합니다. 그래서 세 개가 있지만 이름이 없습니다. 이름을 알아야하므로 조인을하겠습니다. 조인을 수행하면 이제 다시 미리 볼 수 있도록 이름을 가진 테이블이 있습니다. 그래서이 이름은 형식이 좋고, 대문자로 된 이름을 가지고 있습니다. 각 기관의 이름을 가진 하나의 행이있는 것 같습니다. 그래서 그것을 잡을 것입니다. 이제 가입 조건이 필요합니다.

Alation이 수행하는 작업은 쿼리 로그를 다시 살펴보고이 두 테이블이 조인 된 이전 시간을보고 조인하는 다른 방법을 제안합니다. 다시 한번, 약간의 개입이 있습니다. 이 중 하나를 보면 집계 분석에만 사용해야한다는 경고가 표시됩니다. 기관별로 기관을 통해 무언가를 시도하면 아마도 잘못된 일을 일으킬 것입니다. 반면, OPE ID를 가진 것은 대학 수준의 데이터를 원할 경우이 두 테이블을 조인하는 올바른 방법으로 승인됩니다. 그래서 나는 그것을하고 짧은 쿼리이지만, 실제로 데이터가 무엇인지에 대한 통찰력이 없어도 쿼리를 작성했습니다. 실제로이 데이터 세트의 ER 다이어그램을 본 적이 없지만 관련 정보가 나와 있기 때문에 이미이 데이터에 대해 많은 것을 알고 있습니다.

이러한 기능은 통합 쿼리 도구를 통해 카탈로그가 쿼리 작성시 워크 플로에 직접 영향을 미치는 세 가지 방법 중 하나입니다. 그러나 쿼리 도구를 카탈로그와 통합하면 얻을 수있는 또 다른 이점 중 하나는 쿼리를 마치고 저장하면 "기관 수업료 및 교수 급여"와 같은 제목을 넣을 수 있다는 것입니다. 카탈로그에 게시 할 수 있습니다. 이것을 다시 피드백하는 것이 매우 쉬워졌습니다. 게시하지 않더라도 쿼리 로그의 일부로 캡처되고 있지만 게시 할 때 실제로 모든 데이터 지식이 존재하는 중앙 위치의 일부가됩니다.

Alation의 모든 쿼리 검색을 클릭하면 여기로 이동합니다. 여기에 더 많은 카탈로그 인터페이스가 표시됩니다. 쿼리를 검색하는 방법을 보여주는 전용 쿼리 검색으로 이동합니다. 전체 조직. 그리고 새로 게시 된 쿼리가 맨 위에 있다는 것을 알 수 있습니다. 쿼리를 캡처 할 때 저자도 캡처 할 수 있습니다. 저자 인 저와 지금 알고있는 데이터 개체간에 이러한 관계를 설정합니다. 그리고 나는이 쿼리와 이러한 데이터 객체에 대한 전문가로 설립되었습니다. 사람들이 데이터에 대해 배우고 갈 때 올바른 사람을 찾을 수있을 때 도움이됩니다. 그리고 실제로 고급 분석가이든 상관없이 데이터에 익숙하지 않다면 고급 분석가로서이를 살펴보고 새로운 데이터 세트를 시작할 수있는 많은 예제를 볼 수 있습니다. SQL에 정통하지 않은 사람은 내가 활용할 수있는 보고서 인 미리 만들어진 쿼리를 찾을 수 있습니다.

Phil Mazanett의 SAT 평균 점수는 다음과 같습니다. 이것을 클릭하면 쿼리 자체에 대한 일종의 카탈로그 페이지가 나타납니다. 이 쿼리를 참조하는 작성된 기사에 대해 이야기하므로 사용법을 배우고 싶다면 읽어야 할 문서가 있습니다. 그리고 Compose 버튼을 클릭하여 쿼리 도구에서 열 수 있으며 편집하지 않고도 여기에서 직접 실행할 수 있습니다. 실제로 쿼리를 작성할 때 이와 같은 템플릿 변수를 넣을 수 있고 쿼리 기반의 쿼리를 실행할 수있는 간단한 방법을 만드는 간단한 경량보고 기능을 볼 수 있습니다. 몇 가지 매개 변수에.

그것이 제가 데모를 위해 가지고있는 것입니다. 슬라이드로 다시 전환하겠습니다. 간단히 설명하자면, 데이터 관리자 인 관리자가 쿼리 도구에 표시되는 개체에 경고를 표시하여 Alation이 데이터 개체 사용에 대한 지식을 사용하여 현명한 제안을하는 방법, 가져 오는 방법을 보여주었습니다. 특정 객체를 만질 때 분석가의 워크 플로를 개선하기위한 프로파일 링 및 기타 팁과 새로운 쿼리가 작성 될 때 이러한 모든 종류가 카탈로그로 피드백되는 방식에 대해 설명합니다.

분명히 저는 회사를 대표하는 대변인입니다. 데이터 카탈로그에 대해 좋은 말을하겠습니다. Safeway의 Kristie Allen은 고객 중 한 사람의 의견을 직접 듣고 싶다면 분석가 팀을 운영하고 마케팅 실험을 진행하기 위해 실제로 시계를 이겨야하는 시간과 전체적인 방법에 대한 멋진 이야기를합니다. 팀은 Alation을 사용하여 해당 프로젝트에서 매우 빠르게 협업하고 전환했습니다. 따라서이 bit.ly 링크를 따라 해당 스토리를 확인하거나 Alation이 데이터 카탈로그를 조직에 가져올 수있는 방법에 대해 조금만 듣고 싶다면 개인화 된 데모를 설정해 드리겠습니다. 고마워

Rebecca Jozwiak : 정말 고마워, David. 관객 Q & A로 넘어 가기 전에 Dez와 Robin에게 몇 가지 질문이있을 것입니다. 데즈, 먼저 가고 싶니?

Dez Blanchfield : 물론입니다. 이 게시 된 쿼리 개념에 대한 아이디어를 작성 원본과 다시 연결하는 것을 좋아합니다. 나는 사내 앱 스토어에 대한이 아이디어의 오랜 챔피언이었으며 이것이 그것을 기반으로하는 정말 훌륭한 기초라고 생각합니다.

저는 여러분이이 일을하는 일부 조직과 도구와 플랫폼을 활용하여 데이터를 발견하는 전체 여정에서 얻은 성공 사례에 대해 약간의 통찰력을 얻었습니다. 그런 다음 내부 문화 및 행동 특성을 변화시킵니다. 이제 이러한 종류의 사내 앱 스토어를 다운로드 만하면 찾을 수있을뿐 아니라 실제로 그 지식을 유지하는 사람들과 함께 작은 커뮤니티를 개발할 수 있습니다.

데이비드 크로포드 : 예, 우리가 놀랐습니다. 우리는 과거 Adtech의 제품 관리자로서 이야기를 나눈 모든 고객들과 쿼리를 공유하는 것의 가치를 믿지만 고객이 가장 먼저하는 일 중 하나에 대해 여전히 놀랐습니다. 그들이 Alation에서 얻는 가치로 이야기하십시오.

저는 Invoice2go라는 고객 중 한 곳에서 쿼리 도구에 대한 사용자 테스트를 수행하고 있었고 비교적 새로운 제품 관리자를 보유하고 있다고 말했습니다. 그는 실제로 사용자 테스트 중에 프롬프트되지 않은 상태라고 말했습니다. 알 래스가 쉽게 할 수 있다는 점을 제외하고는 SQL을 작성해야합니다.”물론 PM으로서 저는“무슨 일을했는지, 우리는 어떻게 했습니까?”라고 말했습니다. 로그인 할 수 있고 기존 쿼리를 모두 볼 수 있기 때문입니다.”SQL로 빈 슬레이트로 시작하는 것은 매우 어려운 일이지만, 기존 쿼리를 수정하여 결과를 볼 수 있고 "아, 이 여분의 열만 있으면됩니다."또는 "특정 범위의 날짜로 필터링해야합니다"는 훨씬 쉬운 일입니다.

우리는 제품 관리자, 영업 운영 담당자, 픽업을 시작하고 항상 SQL을 배우고이 카탈로그를 사용하여 SQL을 배우기를 원하는 사람들과 같은 이러한 보조 역할을 보았습니다. 우리는 또한 많은 회사들이 일종의 오픈 소스를 시도하는 것을 보았습니다. 내부적으로 이러한 종류의 것들을 구축하여 쿼리를 추적하고 사용 가능하게 만들려고 노력했으며 실제로 유용한 까다로운 디자인 과제가 있습니다. Facebook에는 Hive에 작성된 모든 쿼리를 캡처하는 HiPal이라는 내부 도구가 있지만, 사용자가 올바른 방식으로 사용자를 방해하지 않으면 결국에는 매우 긴 select 문 목록. 그리고 쿼리가 나에게 유용한 지 또는 좋은지 알아 내려고하는 사용자로서, 긴 select 문 목록을 살펴보면 거기에서 가치가없는 것을 얻는 데 훨씬 오래 걸릴 것입니다 처음부터 시작합니다. 우리는 올바른 것들을 앞으로 가져와 유용한 방법으로 제공하는 쿼리 카탈로그를 만드는 방법에 대해 매우 신중하게 생각했습니다.

Dez Blanchfield : 저는 우리 모두가 아주 어린 나이부터 성인에 이르기까지 여러 방법으로이 여정을 겪고 있다고 생각합니다. 많은 기술. 나는 개인적으로 코드를 자르는 법을 배우는 것과 똑같은 진짜 일을 겪었습니다. 저는 잡지를 읽은 다음 책을 훑어보고 특정 수준으로 공부 한 다음에 가서 더 많은 훈련과 교육을 받아야했습니다.

그러나 우연히도 나는 나 자신을 가르치고 잡지를 읽고 책을 읽고 다른 사람들의 프로그램을 자르고 과정을 밟을 때조차도 다른 사람들과 대화하면서 과정을 배우는 것만 큼 많은 것을 배우는 것을 발견했습니다. 경험이있는 사람들. 그리고 저는 데이터 분석에이를 가져 왔기 때문에 우리는 기본적으로 그와 동일한 견해를 보았습니다. 인간은 항상 똑똑합니다.

내가 정말로 이해하고 싶은 또 다른 것은 매우 높은 수준에서 많은 조직들이“그 시점에 도달하는 데 시간이 얼마나 걸립니까?”라고 물을 것입니다. 사람들이 갈 때 시간 단위로 티핑 포인트는 무엇입니까? 플랫폼을 설치하고 도구 유형을 찾기 시작 했습니까? ROI가 더 이상 존재하지 않기 때문에 더 이상 ROI에 대해 더 이상 걱정하지 않는다는 사실을 깨닫는 사람들이이 일을보고있는 순간을 얼마나 빨리 알 수 있습니까? 그러나 이제는 실제로 비즈니스 방식을 바꾸고 있습니다 ? 그리고 그들은 잃어버린 예술을 발견했으며, 정말 재미있는 일을 할 수있을 것으로 기대합니다.

데이비드 크로포드 : 예, 조금만 터치하면됩니다. 우리가 설치 될 때, 데이터 시스템에 직접 연결된 카탈로그에 대해 사람들이 좋아하는 것 중 하나는 좋은 점 중 하나라고 생각합니다. 한 페이지 씩. 그리고 이것은 빈 도구로 시작하고 문서화하려는 모든 것을위한 페이지를 작성해야하는 이전 데이터 솔루션의 경우에도 마찬가지입니다.

소프트웨어를 설치 한 후 며칠 안에 메타 데이터를 추출하여 많은 것들을 자동으로 문서화하기 때문에 도구에 80 % 이상의 데이터 환경을 담을 수 있습니다. 그런 다음 사람들이 도구를 사용하여 쿼리를 작성하자마자 자동으로 카탈로그에 다시 저장되므로 표시되기 시작합니다.

나는 그것을 진술하는 데 열중하고 싶지 않습니다. 나는 2 주가 한 달에 매우 보수적 인 추정치라고 생각합니다. 한 달에 2 주에서 한 달 동안, 실제로 돌아 서서 가치를 얻는 것처럼 느끼는 보수적 인 추정치, 지식을 공유하기 시작하고 데이터에 대한 정보를 찾을 수있는 것처럼 말입니다.

Dez Blanchfield : 생각할 때 정말 놀랍습니다. 효과적으로 인덱싱 및 카탈로그를 작성하는 일부 대규모 데이터 플랫폼이 제대로 구현 및 배포되고 제대로 구축 되려면 최대 1 년이 소요될 수 있습니다.

Robin Bloor로 넘어 가기 전에 마지막으로해야 할 질문은 커넥터입니다. 나에게 즉시 튀어 나오는 것 중 하나는 분명히 모든 도전 과제가 정리되어 있다는 것입니다. 따라서 몇 가지 질문이 정말 빨리 있습니다. 하나, 커넥터는 얼마나 빨리 구현됩니까? 당연히 Oracle, Teradatas, DB2와 같은 가장 큰 플랫폼으로 시작해야합니다. 그러나 새로운 커넥터가 얼마나 정기적으로 제공되는지, 그리고 어느 정도의 처리 시간이 걸립니까? 표준 프레임 워크가 있다고 생각합니다. 그리고 당신은 얼마나 깊이 들어가 있습니까? 예를 들어, 전 세계의 Oracle 및 IBM, 심지어 Tereadata 및 가장 인기있는 최신 오픈 소스 플랫폼이 있습니다. 그들은 당신과 직접 일하고 있습니까? 스스로 발견하고 있습니까? 해당 플랫폼에 대한 내부 지식이 있어야합니까?

커넥터를 개발하는 것은 어떤 모습이며, 이러한 커넥터가 가능한 모든 것을 발견하도록 파트너쉽에 얼마나 깊이 관여하고 있습니까?

데이비드 크로포드 : 네, 물론 좋은 질문입니다. 대부분 커넥터를 개발할 수 있다고 생각합니다. 우리는 더 젊은 신생 기업이었고 고객이 없었을 때 확실히했습니다. 내부 액세스 없이도 연결을 확실히 개발할 수 있습니다. 우리는 공개적으로 제공되지 않는 데이터 시스템에 특별한 접근 권한을 얻지 못하며 종종 내부 정보가 필요하지 않습니다. 우리는 데이터 시스템 자체가 이용할 수있는 메타 데이터 서비스를 이용합니다. 종종 그것들은 꽤 복잡하고 다루기가 어려울 수 있습니다. 특히 SQL Server가 쿼리 로그를 관리하는 방식을 알고 있으며 여러 가지 구성이 있으며 실제로 작업해야합니다. 올바르게 설정하려면 뉘앙스와 노브 및 다이얼을 이해해야합니다. 이는 여러 번 수행 한 이후로 고객과 협력하는 것입니다.

그러나 어느 정도는 사용 가능한 공개 API 또는 우리가 활용하는 공개 인터페이스입니다. 우리는 인증의 근거가되는 여러 회사들과 파트너쉽을 맺고 있으며, 따라서 우리가 일하고 있고 우리에게 테스트를위한 리소스를 제공 할 수 있다고 느끼고, 때로는 플랫폼에 대한 조기 액세스를 보장 할 수 있습니다. 우리는 새로운 버전으로 작업합니다.

새로운 연결을 바꾸려면 보수적 인 노력을 기울이려고 다시 6 주에서 2 개월을 가정 해 보겠습니다. 그것은 얼마나 비슷한 지에 달려 있습니다. 따라서 일부 Postgre는 Redshift와 매우 유사하게 작동합니다. Redshift와 Vertica는 많은 세부 사항을 공유합니다. 그래서 우리는 그런 것들을 활용할 수 있습니다. 그러나 6 주에서 2 개월은 공정 할 것입니다.

우리는 또한 API를 가지고 있습니다 – 우리는 Alation을 메타 데이터 플랫폼으로 생각합니다. 만약 우리가 접근 할 수없고 자동으로 잡을 수없는 것이 있다면, 커넥터를 직접 작성하여 시스템에 넣을 수있는 방법이 있습니다. 모든 것이 여전히 단일 검색 엔진에 집중되어 있습니다.

Dez Blanchfield : 환상적입니다. 알겠습니다. 그래서 우리는 로빈에게 넘겨 줄 것입니다. 왜냐하면 그는 또한 많은 질문을 가지고 있기 때문입니다. 남자 이름?

Rebecca Jozwiak : Robin이 음소거 상태 일 수 있습니다.

Dez Blanchfield : 음소거 상태입니다.

로빈 블로어 : 네. 죄송합니다. 나 자신을 음소거했습니다. 이것을 구현할 때 프로세스는 무엇입니까? 많은 곳에서 많은 데이터가있을 수 있기 때문에 궁금합니다. 어떻게 작동합니까?

데이비드 크로포드 : 네. 먼저 서버를 프로비저닝하고 네트워크 연결을 사용할 수 있는지 확인하고 포트가 열려 시스템에 실제로 액세스 할 수 있도록하는 일종의 IT 프로세스입니다. 그들은 모두 어떤 시스템으로 시작하고 싶은지 종종 알고 있습니다. 데이터 시스템 내부를 아는 것 – 때로는 도움이 될 것입니다. 시스템에서 누가 무엇을 사용하고 있고 얼마나 많은 사용자를 사용하는지 이해하기 위해 쿼리 로그를 처음으로 살펴볼 수 있도록 도와줍니다. 따라서 우리는 어디에서 찾을 수 있는지 도움을 줄 것입니다. 데이터베이스에 로그인 할 수있는 사람이 수백 또는 수천 명인 경우 실제로 로그인 한 위치를 알 수 없으므로 쿼리는 실제로 몇 달 동안 여기에 로그인하여 쿼리를 실행 한 고유 사용자 계정 수를 기록합니다.

그래서 우리는 그것을 이용할 수 있지만 종종 가장 중요한 것들에서만 이용할 수 있습니다. 우리는 그것들을 설정하고 "우선 순위를 정하자"라고 말하는 과정이 있습니다. 병렬로 발생할 수있는 다양한 활동이 있습니다. 쿼리 도구 사용 교육에 중점을 두었습니다. 일단 사람들이 쿼리 도구를 사용하기 시작하면, 많은 사람들이 다른 모든 시스템에 대한 단일 인터페이스라는 사실을 좋아합니다. 또한 웹 기반이며, 원치 않으면 설치가 필요하지 않다는 사실을 좋아합니다. 보안 관점에서 볼 때 이들은 네트워크 관점에서 일종의 회사 IT 네트워크와 프로덕션 데이터 소스가있는 데이터 센터간에 단일 진입 점을 갖는 것을 좋아합니다. 따라서 Alation을 쿼리 도구로 설정하고 이러한 모든 시스템의 액세스 지점으로 Compose를 사용하기 시작합니다.

일단 이런 일이 발생하면 교육에 중점을 둔 것은 웹 기반 또는 서버 기반 쿼리 도구와 데스크톱에서 사용하는 것과 도구의 차이점과 차이점에 대해 이해하는 것입니다. 그. 그리고 동시에 우리가하려고하는 것은 가장 유용한 데이터를 식별하고 다시 쿼리 로그 정보를 활용하고“여러분이 들어가서 사람들이이를 이해하도록 도울 수 있습니다. 이 테이블에 대표 쿼리를 게시 해 봅시다.”때로는 사람들을 매우 빠르게 해낼 수있는 가장 효과적인 방법입니다. 자신의 검색어 기록을보고 첫 번째 검색어로 표시되도록 이러한 내용을 게시 해 보겠습니다. 사람들이 테이블 페이지를 보면 해당 테이블을 터치 한 모든 쿼리를 볼 수 있으며 거기서부터 시작할 수 있습니다. 그런 다음 제목과 설명을 쉽게 찾고 검색 할 수 있도록 이러한 개체에 제목과 설명을 추가하여 사용 방법에 대한 뉘앙스를 알아 봅시다.

계보를 생성 할 수 있도록 쿼리 로그를 철저히 검토해야합니다. 우리가하는 일 중 하나는 데이터가 한 테이블에서 다른 테이블로 이동할 때 쿼리 로그를 살펴 보는 것입니다. 그러면 데이터 테이블에 대해 가장 자주 묻는 질문 중 하나를 어디에서 얻을 수 있습니까? 그것을 어떻게 믿습니까? 그리고 우리가 보여줄 수있는 것은 어떤 다른 테이블에서 왔을뿐만 아니라 그 과정에서 어떻게 변환되었는지입니다. 다시 말하지만, 이것은 일종의 쿼리 로그에 의해 구동됩니다.

그래서 우리는 그러한 것들이 설정되고 시스템에 연계되고 있는지 확인하고 테이블 페이지에서 설정할 수있는 가장 가치 있고 가장 활용도가 높은 메타 데이터를 대상으로합니다. 검색 할 때 유용한 정보가 있습니다.

로빈 블로어 : 알겠습니다. 다른 질문은 – 청중으로부터 많은 질문이 있기 때문에, 여기서 너무 많은 시간을 들이고 싶지는 않습니다 – 다른 종류의 질문이 떠오르는 다른 질문은 단지 고통의 포인트입니다. 사람들이 어떤면에서 어려움을 겪고 있기 때문에 많은 소프트웨어를 구입했습니다. 그렇다면 사람들을 알 레이션으로 이끄는 일반적인 고통은 무엇입니까?

데이비드 크로포드 : 예. 나는 몇 가지가 있다고 생각하지만, 우리가 자주 듣는 것 중 하나는 분석가 온 보딩이라고 생각합니다. "저는이 데이터에서 새로운 통찰력을 얻어야하는 단기적으로 10, 20, 30 명의 직원을 고용해야합니다. 어떻게하면 속도를 높일 수 있을까요?" 태클. 또한 선임 분석가가 다른 사람들의 데이터에 대한 질문에 대답하는 데 시간을 낭비하지 않아도됩니다. 그것은 또한 매우 빈번한 것입니다. 그리고 둘 다 본질적으로 교육 문제입니다.

그리고 Alation을 채택한 사람들이 누군가가 일할 수있는 새로운 데이터 환경을 구축하고 싶을 때 또 다른 장소를 말하고 싶습니다. 사람들이 활용할 수 있도록 내부적으로이를 광고하고 마케팅하고 싶습니다. 그런 다음 Alation을 새로운 분석 환경의 프론트 엔드로 만드는 것은 매우 호소력이 있습니다. 여기에는 문서가 있고, 시스템에 대한 단일 액세스 지점 인 단일 소개 지점이 있으므로 사람들이 우리에게 올 수있는 또 다른 곳입니다.

Robin Bloor : 좋습니다. 관중이 당신에게 다가 가기 때문에 Rebecca에게 전달하겠습니다.

Rebecca Jozwiak : 그렇습니다. 여기에는 정말 좋은 청중들이 많이 있습니다. 그리고 데이빗, 이건 특별히 당신에게 주어졌습니다. 사람들에게 쿼리를 잘못 사용하는 경험이있는 사람이 왔으며 사용자에게 권한을 부여할수록 컴퓨팅 리소스의 책임있는 사용을 통제하는 것이 더 어렵다고 말합니다. 따라서 잘못 안내되었지만 일반적인 검색어 문구가 전파되는 것을 막을 수 있습니까?

David Crawford : 예, 이 질문이 있습니다. 좋은 질문입니다 – 우리가 자주하는 질문입니다. 사용자를 교육해야하는 이전 회사에서 어려움을 겪었습니다. 예를 들어“이것은 로그 테이블이며 몇 년 동안 로그가 되돌아갑니다. 이 테이블에 쿼리를 작성하려면 날짜별로 제한해야합니다.”예를 들어, 이는 데이터베이스에 액세스하기 전에 이전 회사에서했던 교육입니다.

이 문제를 해결하기 위해 몇 가지 방법이 있습니다. 쿼리 로그 데이터가이를 해결하는 데있어 고유 한 가치가 있다고 생각합니다. 데이터베이스가 쿼리 플래너를 사용하여 내부적으로 수행하는 작업과 다른 통찰력을 제공합니다. 그리고 우리가하는 일은 그러한 개입 중 하나입니다 – 우리는 제가 직접 보여준 수동 개입이 있습니다. 예를 들어, 특정 조인에서 "이 기능을 사용하지 마십시오"라고 말할 수 있습니다. 스마트 제안에 표시되면 큰 적기가 나타납니다. 이것이 사람들에게 다가가는 한 가지 방법입니다.

우리가하는 또 다른 일은 실행 시간 개입시 자동화됩니다. 실제로 쿼리를 실행하기 전에 쿼리의 구문 분석 트리를 사용하고 특정 필터 또는 우리가 수행하는 몇 가지 다른 작업을 포함합니까? 그러나 가장 귀중한 것들 중 하나이며 설명하기 가장 간단한 것은 필터가 포함되어 있습니까? 방금 제공 한 예와 같이이 로그 테이블은 쿼리하려는 경우 날짜 범위를 가져야하며, 테이블 페이지에서 해당 날짜 범위 필터를 적용하도록 지정할 수 있습니다. 누군가가 해당 필터를 포함하지 않는 쿼리를 실행하려고하면 실제로 큰 경고로 필터를 중지 시키며 "이것과 같은 SQL을 쿼리에 추가해야합니다"라고 말합니다. 그들은 원한다. 우리는 그것들이 실제로 그것을 사용하는 것을 완전히 금지하지는 않을 것입니다. – 그것은 또한 쿼리이기도합니다. 결국에는 쿼리를 실행해야합니다. 그러나 우리는 그들 앞에 꽤 큰 장벽을 두었고 성능을 향상시키기 위해 쿼리를 수정하기위한 구체적으로 적용 가능한 제안을 제안합니다.

또한 실제로는 쿼리 로그를 관찰하여 자동으로 수행하는 경우도 있습니다. 이 테이블에서 쿼리의 일부가 특정 필터 나 특정 조인 절을 이용한다는 것을 알게되면 실제로 해당 팝업이 나타납니다. 우리는이를 중재에 홍보 할 것입니다. 실제로 내부 데이터 세트에서 발생했습니다. 우리는 고객 데이터를 가지고 있으며 사용자 ID는 있지만 사용자 ID는 종류가 있기 때문에 모든 고객에 대해 사용자 ID를 가지고 있습니다. 고유하지 않으므로 고유 한 조인 키를 얻으려면 클라이언트 ID와 쌍을 이루어야합니다. 그리고 쿼리를 작성하고 있는데 무언가를 분석하려고했는데 팝업이 나타났습니다.“다른 사람들은 모두 클라이언트 ID와 사용자 ID로이 테이블을 조인하는 것 같습니다. 그렇게하고 싶지 않습니까?”그리고 실제로 잘못된 분석을하지 못했습니다. 따라서 분석의 정확성과 성능 모두에서 작동합니다. 이것이 우리가 그 문제를 해결하는 방법입니다.

Rebecca Jozwiak : 저에게 효과적 일 것 같습니다. 당신은 사람들이 자원을 낭비하는 것을 반드시 막지는 않을 것이라고 말했지만, 그들이하고있는 일이 최선이 아닐 수도 있다고 가르칩니다.

David Crawford : 우리는 항상 사용자가 악의적이지 않다고 가정하고 최선의 의도를 제시합니다.

레베카 요 즈윅 : 알겠습니다. 또 다른 질문이 있습니다.“솔루션과 같은 카탈로그 관리자와 MDM 도구의 차이점은 무엇입니까? 또는 MDM은 자동으로 수행하지만 메타 데이터 수집의 기본 원칙은 동일하지만 쿼리 테이블의 선택 범위를 넓히면 실제로 다른 주체에 의존합니까? "

David Crawford : 예. 전통적인 MDM 솔루션을 볼 때 가장 큰 차이점은 철학적 인 것입니다. 사용자가 누구인지에 관한 것입니다. 프레젠테이션의 시작 부분에서 언급 한 것처럼 Alation, 우리가 창립되었을 때 분석가가 더 많은 통찰력을 생성하고 더 빠르게 생성하며 더 정확한 통찰력을 얻을 수 있도록하는 목표를 가지고 설립 된 것 같습니다. 생산액. 나는 이것이 전통적인 MDM 솔루션의 목표라고 생각하지 않습니다. 이러한 솔루션은 SCC에 또는 내부적으로 다른 종류의 감사 목적으로 수집 된 데이터에 대한 보고서를 작성해야하는 사람들을 대상으로하는 경향이 있습니다. 때로는 분석가를 가능하게 할 수도 있지만, 실무자가 실무를 가능하게 할 경우 DBA와 같은 데이터 아키텍트를 가능하게 할 가능성이 더 큽니다.

분석가의 입장에서 생각할 때 MDM 도구가 결코 할 수없는 쿼리 도구를 작성하기 시작합니다. 그때는 성과뿐만 아니라 정확성에 대해 생각하고 비즈니스 요구와 관련된 데이터를 이해하기 시작합니다. 이 모든 것은 우리가 도구를 설계 할 때 우리 마음에 떠오르는 것입니다. 검색 알고리즘에 들어가고 카탈로그 페이지의 레이아웃에 들어가고 조직 전체의 지식을 제공 할 수 있습니다. 우리는 쿼리 도구를 구축하고 카탈로그를 직접 카탈로그에 구축했다는 사실에 들어갑니다. 어떤 사용자를 먼저 생각하십니까?

Rebecca Jozwiak : 좋습니다. 그것은 실제로 그것을 설명하는 데 도움이되었습니다. 그는 떠나야했기 때문에 기록 보관소를 얻기 위해 죽어 가고 있었지만 실제로 그의 질문에 대한 답변을 원했습니다. 그는 처음에는 여러 언어가 있다고 언급되었지만 SQL은 Compose 구성 요소 내에서 활용되는 유일한 언어입니까?

데이비드 크로포드 : 그렇습니다. 그리고 제가 알아 차 렸던 것 중 다른 유형의 데이터베이스, 문서 데이터베이스, 그래프 데이터베이스, 주요 가치 저장소의 폭발이 목격 되었기 때문에 실제로 응용 프로그램 개발에 강력하다는 것입니다. 관계형 데이터베이스보다 더 나은 방법으로 특정 요구를 실제로 잘 처리 할 수 ​​있습니다.

그러나 데이터 분석으로 다시 가져 오거나 다시 가져올 때 – 임시보고 또는 데이터를 임시로 파기하려는 사람들에게 해당 정보를 제공하려는 경우 항상 관계형으로 돌아옵니다. 적어도 인간을위한 인터페이스. 그 중 일부는 SQL이 데이터 분석의 링구아 프랑카이기 때문에 인간에게는 통합 도구에도 해당됩니다. 나는 이것이 Hadoop의 SQL이 인기가 있고 그것을 해결하려는 시도가 너무 많은 이유라고 생각합니다. 하루가 끝나면 사람들이 알고 있기 때문입니다. SQL을 작성하는 방법을 아는 사람은 수백만 명에 달하며 Mongo 집계 파이프 라인 프레임 워크 쿼리를 작성하는 방법을 아는 사람은 수백만 명에 달하지 않습니다. 그리고 그것은 매우 다양한 플랫폼에서 통합에 사용되는 표준 언어입니다. 즉, 대부분의 분석가가 사용하는 인터페이스이기 때문에 SQL 작성에 중점을 둔 곳이기 때문에 대부분의 분석가가 사용하는 인터페이스이기 때문에 외부로 나가는 일은 거의 없습니다.

데이터 과학은 그들이 가장 외부에 투자하는 곳이라고 말하고, 그래서 우리는 Pig 나 SAS를 사용하는 것에 대해 가끔 질문을받습니다. 이것들은 Compose에서 확실히 처리하지 않으며 카탈로그에서 캡처하려는 것입니다. 그리고 R과 Python도 보았습니다. R 및 Python 스크립트 내부에서 Alation으로 작성된 쿼리를 사용할 수있는 인터페이스를 만들 수있는 몇 가지 방법이 있습니다. 따라서 데이터 과학자이고 스크립팅 언어로 작업 할 때 소스 데이터는 관계형 데이터베이스에 있습니다. SQL 쿼리로 시작한 다음 추가로 처리하고 R 및 Python 내에 그래프를 만듭니다. 또한 Alation에서 쿼리 또는 쿼리 결과를 가져 오는 스크립트로 가져올 수있는 패키지를 만들었으므로 혼합 워크 플로를 만들 수 있습니다.

Rebecca Jozwiak : 좋습니다. 나는 우리가 시간의 상단을 약간 뛰어 넘었다는 것을 알고 있습니다. 나는 단지 하나 또는 두 개의 질문을 더 할 것입니다. 연결할 수있는 모든 다른 시스템에 대해 이야기했지만 외부 호스팅 데이터 및 내부 호스팅 데이터에 대해 단일 뷰에서 단일 플랫폼으로 검색 할 수 있습니까?

데이비드 크로포드 : 물론입니다. 몇 가지 방법이 있습니다. 내 말은, 외부 호스팅, 나는 그것이 무엇을 의미하는지 정확히 생각하려고 노력하고 있다고 상상할 것입니다. 누군가가 AWS에서 호스팅하는 데이터베이스를 의미 할 수 있습니다. data.gov의 공개 데이터 소스를 의미 할 수 있습니다. 데이터베이스 계정을 사용하여 다른 응용 프로그램과 마찬가지로 로그인하여 데이터베이스에 직접 연결하면 메타 데이터를 추출 할 수 있습니다. 따라서 계정이 있고 네트워크 포트가 열려 있으면 접속할 수 있습니다. 그런 다음 가상 데이터 소스가 없으면 자동으로, 자체 커넥터를 작성하거나 CSV 업로드처럼 작성하여 문서를 자동으로 푸시 할 수있는 가상 데이터 소스라는 것이 있습니다. 내부 데이터와 함께 데이터를 문서화합니다. 그것은 모두 검색 엔진에 배치됩니다. 시스템 내부의 기사 및 기타 문서 및 대화 내에서 참조 가능합니다. 이것이 바로 시스템에 직접 연결할 수 없을 때 처리하는 방식입니다.

Rebecca Jozwiak : 알겠습니다. 질문 하나만 더 드리겠습니다. 한 참석자는 "소스 데이터가 수정 될 때 소스 데이터가 업데이트 될 때 데이터 카탈로그의 내용을 어떻게 확인, 확인 또는 유지 관리해야합니까?"

데이비드 크로포드 : 예, 우리가 많이받는 질문입니다. 제가 말한 것처럼 철학 중 하나는 사용자가 악의적이라고 믿지 않습니다. 우리는 그들이 최고의 지식을 제공하려고 노력한다고 가정합니다. 그들은 데이터에 대해 고의적으로 사람들을 오도하지 않을 것입니다. 조직에 문제가 있다면 Alation이 올바른 도구가 아닐 수도 있습니다. 그러나 사용자가 좋은 의도를 가지고 있다고 생각하면 업데이트가 발생하는 곳으로 생각하고 일반적으로 우리가하는 일은 각 데이터 객체 또는 데이터의 각 섹션을 관리하는 관리자입니다. 또한 메타 데이터를 변경하면 해당 관리자에게 알릴 수 있으며이를 처리 할 수 ​​있습니다. 업데이트가 들어오는 것을 확인하고 확인합니다. 그들이 옳지 않다면, 돌아가서 수정하고 정보를 제공 할 수 있으며, 정보를 제공하고 배우는 데 도움이되는 사용자에게 다가 갈 수 있기를 바랍니다.

이것이 우리가 생각하는 기본 방식입니다. 이런 종류의 제안은 청중들과 경영진들에 의해 관리되므로 우리는 그 주변에 몇 가지 기능이 있습니다.

Rebecca Jozwiak : 좋습니다. 그리고 사람들에게 Alation을 가장 잘 시작할 수있는 방법과 자세한 정보를 얻기 위해 구체적으로 어디를 갈 수 있는지 알려주십시오. 나는 당신이 한 비트를 공유한다는 것을 알고 있습니다. 그게 최고의 장소인가요?

David Crawford : Alation.com/learnmore 좋은 방법이라고 생각합니다. 데모에 등록하기 위해 Alation.com 사이트에는 많은 훌륭한 리소스, 고객 백서 및 솔루션에 대한 뉴스가 있습니다. 그래서 시작하기에 좋은 곳이라고 생각합니다. 이메일을 보낼 수도 있습니다.

Rebecca Jozwiak : 좋습니다. And I know, attendees, sorry if I didn't get to all of the questions today, but if not, they will be forwarded to David or his sales team or somebody at Alation, so they can definitely help answer your questions and help understand what Alation does or what they do best.

And with that, folks, I'll go ahead and sign us off. You can always find the archives at InsideAnalysis.com. You can also find it at Techopedia.com. They tend to update a little bit quicker, so definitely check that out. And thanks so much to David Crawford, Dez Blanchfield and Robin Boor today. It's been a great webcast. And with that, I'll bid you farewell. Thanks, folks. Bye bye.

David Crawford: Thank you.

제안의 힘 : 데이터 카탈로그가 분석가에게 힘을 실어주는 방법