오디오 Firehose 활용 : 스트리밍 분석에서 비즈니스 가치 얻기 : 웹 세미나 기록

Firehose 활용 : 스트리밍 분석에서 비즈니스 가치 얻기 : 웹 세미나 기록

Anonim

작성자 : Techopedia Staff, 2016 년 2 월 24 일

테이크 아웃 : 호스트 Rebecca Jozwiak가 업계 최고의 전문가와 스트리밍 분석에 대해 논의합니다.

현재 로그인하지 않았습니다. 비디오를 보려면 로그인 또는 가입하십시오.

Rebecca Jozwiak : 신사 숙녀 여러분 2016 년 Hot Technologies에 오신 것을 환영합니다! 오늘의 제목은“Firehose 강화 : 스트리밍 분석에서 비즈니스 가치 얻기”입니다. 이것이 Rebecca Jozwiak입니다. 에릭 카바나 (Eric Kavanagh)가 여기에 없을 때마다 웹 캐스트 호스트를위한 두 번째 명령입니다. 그래서 오늘 많은 분들을 만나게되어 반갑습니다.

이 에피소드는 다른 에피소드와 약간 다릅니다. 우리는 뜨거운 것에 대해 이야기했고 올해는 뜨겁습니다. 지난 몇 년은 더워졌습니다. 항상 새로운 물건이 나옵니다. 오늘은 스트리밍 분석에 대해 이야기하고 있습니다. 스트리밍 분석은 일종의 새로운 기능입니다. 물론 스트리밍, 센터 데이터, RFID 데이터는 반드시 새로운 것은 아닙니다. 그러나 데이터 아키텍처와 관련하여 우리는 수십 년 동안 유휴 상태의 데이터에 집중 해 왔습니다. 데이터베이스, 파일 시스템, 데이터 리포지토리 – 대부분 일괄 처리를 목적으로합니다. 그러나 이제는 스트리밍 데이터, 데이터 감성, 일부를 리빙 스트림이라고 부르는 가치를 창출하기 위해 변화 해 왔기 때문에 실제로 사용했던 휴지 아키텍처의 데이터가 아니라 스트림 기반 아키텍처가 필요합니다. 빠른 처리, 실시간 또는 거의 실시간 처리. 사물 인터넷뿐만 아니라 모든 것의 인터넷을 수용 할 수 있어야합니다.

물론, 이상적으로는 두 아키텍처가 나란히 살고, 한 손으로 다른 손을 씻는 것이 좋을 것입니다. 오래된 데이터, 몇 주 된 데이터, 오래된 데이터에는 여전히 가치, 과거 분석, 추세 분석이 있지만, 요즘 라이브 인텔리전스를 주도하는 라이브 데이터이기 때문에 스트리밍 분석이 중요한 이유입니다.

나는 오늘 그것에 대해 더 이야기하고 있습니다. 데이터 과학자 인 Dez Blanchfield가 호주에서 전화를 걸어 왔습니다. 아침 일찍이 그를 위해 지금이다. 최고 분석가 인 Dr. Robin Bloor가 있습니다. Impetus Technologies의 StreamAnalytix 제품 책임자 인 Anand Venugopal과 합류했습니다. 그들은 실제로이 공간의 스트리밍 분석 측면에 중점을두고 있습니다.

그걸로 Dez에 전달하겠습니다.

Dez Blanchfield : 감사합니다. 여기 화면의 제어권을 잡고 앞으로 튀어 나와야합니다.

Rebecca Jozwiak : 여기 있습니다.

Dez Blanchfield : 슬라이드를 진행하는 동안 핵심 주제를 다루겠습니다.

나는 그것을 상당히 높은 수준으로 유지하고 대략 10 분 동안 유지할 것입니다. 이것은 매우 큰 주제입니다. 스트림 처리가 무엇인지, 현재 개발중인 프레임 워크와 이러한 대용량 스트림에서 분석을 수행하는 것이 무엇을 의미하는지 자세히 설명하는 데 2 ​​~ 3 일이 소요되는 이벤트에 참여했습니다.

우리는 분석을 스트리밍하여 우리가 의미하는 바를 명확히 한 다음 비즈니스 가치를 도출 할 수 있는지 여부를 조사 할 것입니다. 그것이 실제로 비즈니스가 찾고있는 것이기 때문입니다. 그들은 사람들에게 매우 신속하고 간결하게 설명하도록하려고합니다. 스트림 데이터에 어떤 형태의 분석을 적용하여 가치를 얻을 수 있습니까?

스트리밍 분석이란 무엇입니까?

스트리밍 분석을 통해 조직은 다양한 형태로 비즈니스를 통해 얻은 대용량 및 고속 데이터에서 가치를 추출 할 수 있습니다. 여기서 중요한 차이점은 메인 프레임이 발명 된 이후 수십 년 동안 처리해 온 분석 및 렌즈 개발 데이터와 데이터 뷰의 오랜 역사를 가지고 있다는 것입니다. 지난 3 ~ 5 년 동안 우리가 "웹 스케일"이라고 부르는 대규모 패러다임의 변화는 이벤트 상관 관계를 처리하고 찾는 것이 아니라 실시간 또는 거의 실시간으로 우리에게 들어오는 데이터 스트림을 활용하는 것입니다. 이벤트가 발생하지만 해당 스트림에 대해 매우 상세하고 심층적 인 분석을 수행합니다. 데이터를 수집하여 일종의 리포지토리, 전통적으로 큰 데이터베이스, Hadoop 플랫폼과 같은 큰 빅 데이터 프레임 워크에 배치하고 배치 모드 처리를 수행하는 이전에 수행 한 작업으로의 중요한 전환입니다. 일종의 통찰력.

우리는 그 일을 매우 신속하게 수행하고 많은 양의 철분을 시도하는 데 매우 능숙하지만 여전히 데이터를 수집하고 저장하고보고 약간의 통찰력이나 분석을 얻고 있습니다. 데이터가 스트리밍 될 때 이러한 분석을 수행하는 전환은 빅 데이터와 관련하여 발생하는 유형에있어 매우 새롭고 흥미로운 성장 영역이었습니다. 분석을 캡처, 저장 및 처리하고 수행하기 위해서는 완전히 다른 접근 방식이 필요합니다.

스트림에서 분석을 수행하는 데 주력하고 전환하는 주요 동인 중 하나는 정보가 비즈니스에 제공됨에 따라 데이터가 제공 될 때 더 빠르고 쉽게 이러한 통찰력을 확보함으로써 상당한 비즈니스 가치를 얻을 수 있다는 것입니다. 최종 처리를 수행한다는 아이디어는 이제 특정 산업에서 더 이상 관련이 없습니다. 우리는 즉시 분석을 수행 할 수 있기를 원합니다. 하루가 끝날 무렵, 우리는 하루가 끝나고 24 시간 배치 작업을 수행하고 통찰력을 얻는 것이 아니라 발생한 일을 이미 알고 있습니다.

스트리밍 분석은 해당 스트림을 바로 활용하는 것과 관련이 있으며, 데이터 스트림은 일반적으로 매우 많은 양의 데이터와 데이터를 여러 스트림으로 스트리밍하여 데이터를 매우 신속하고 신속하게 전달하며 반대 방향으로 우리에게 오는 통찰력 또는 분석을 얻습니다 휴식을 취하고 분석을 수행 할 수 있습니다.

앞서 언급했듯이 배치 분석이라고하는 것을 수십 년에서 수십 년 동안 수행했습니다. 여기에 정말 멋진 그림을 넣었습니다. 이것은 평생 RAND Corporation이 만든 모형 컴퓨터 앞에 서있는 신사의 사진으로, 그들은 집안에서 컴퓨터를보기 위해 본 것입니다. 흥미로운 점은 그때까지도이 작은 다이얼의 개념을 모두 가지고 있었으며이 다이얼은 집에서 들어오는 정보를 실시간으로 처리하여 진행 상황을 알려줍니다. 간단한 예는 실시간으로 무슨 일이 일어나는지 알 수있는 기압과 온도의 집합입니다. 하지만 RAND Corporation이 작은 모형을 만들었을 때 실제로 데이터 처리와 스트림 형식으로 데이터를 분석하는 것에 대해 이미 생각하고있었습니다. 왜 그들이 컴퓨터에 스티어링 휠을 넣었는지 잘 모르겠지만, 꽤 멋집니다.

프린터가 발명 된 이후로 데이터를 캡처하고 배치 분석을 수행 할 수있었습니다. 제가 지금 큰 변화에 대해 말씀 드렸듯이 우리 모두가 알고있는 웹 스케일 플레이어들에게서 이것을 보았습니다. 그들은 트위터, 페이스 북, 링크드 인과 같은 모든 가계 브랜드입니다. 플랫폼은 배치 모드로 캡처, 저장 및 처리 할 필요가있을뿐 아니라 실제로 데이터 스트림에서 즉시 분석을 캡처하고 추진합니다. 내가 트윗을 할 때, 그들은 무언가를 캡처하고 저장하고 나중에 할 필요가있을뿐만 아니라, 그것을 즉시 내 스트림에 올려 놓고 나를 따르는 다른 사람들과 공유 할 수 있어야합니다. 그것은 일괄 처리 모델입니다.

우리는 왜이 길을 내려가겠습니까? 스트림 분석 경로를 낮추기위한 노력을 고려할 때 왜 조직이 시간, 노력 및 비용을 투자합니까? 조직은 경쟁이 치열한 업계에서 경쟁사보다 성능을 높이고 자하는이 큰 열망을 가지고 있으며 간단한 스트림 분석을 통해 성능 향상을 신속하게 구현할 수 있으며, 이미 실시간 데이터를 추적하는 것만으로 간단하게 시작할 수 있습니다. 익숙하다. Google 웹 로그 분석의 스크린 샷이 조금 있습니다. 실제로 실제 소비자 수준 분석을 얻은 것은 이번이 처음 일 것입니다. 사람들이 귀하의 웹 사이트를 방문하고 웹 사이트 하단에 작은 자바 스크립트가 웹 사이트에 포함 된 HTML을 사용하여 방문 횟수가 증가함에 따라이 작은 코드는 실시간으로 Google에 다시 작성되었으며 웹 사이트의 모든 페이지, 웹 사이트의 모든 개체에서 실시간으로 들어오는 데이터 스트림에 대한 분석을 수행하고 실시간 그래프 대시 보드의 귀여운 웹 페이지에서 귀여운 히스토그램 및 역사적으로 귀하의 페이지를 방문한 X 명의 사용자를 보여주는 선 그래프이지만 현재 몇 명이나 있습니다.

이 스크린 샷에서 볼 수 있듯이 지금 25라고 표시되어 있습니다. 스크린 샷 당시 25 명의 사용자가 해당 페이지에있었습니다. 이것이 소비자 등급 분석 도구에서 처음으로 플레이 한 기회입니다. 많은 사람들이 실제로 그것을 얻은 것 같습니다. 그들은 무슨 일이 일어나고 있는지, 어떻게 대응할 수 있는지 아는 힘을 이해했습니다. 우리가 비행하는 항공기, 항공 전자 공학의 규모를 생각하면 미국에서만 하루에 18, 700 개의 국내선이 있습니다. 나는 6 ~ 7 년 전의 논문을 읽었습니다. 그 항공기가 생산 한 데이터의 양은 구 엔지니어링 모델에서 약 200 ~ 300MB였습니다. 오늘날의 항공기 설계에서이 항공기는 비행 당 약 500 기가 바이트의 데이터 또는 약 테라 바이트의 데이터를 생성합니다.

미국 우주에서 24 시간마다 18, 700 번의 국내선 항공편을 계산할 때 모든 현대 항공기가 약 테라 바이트를 생산하는 경우 43 ~ 44 페타 바이트의 데이터가 전달되고 비행기가 공중에있는 동안 일어나고 있습니다. 그들이 착륙하고 데이터 덤프를 할 때 일어나고 있습니다. 그들은 상점에 들어가서 엔지니어링 팀으로부터 베어링, 휠 및 엔진 내부에서 발생하는 일을 살펴보기 위해 전체 데이터 덤프를 갖습니다. 이 데이터 중 일부는 실시간으로 처리되어야하므로 비행기가 공중에 있거나 지상에있는 동안 실제 문제가 있는지 판단 할 수 있습니다. 배치 모드에서는 그렇게 할 수 없습니다. 우리가 금융, 건강, 제조 및 엔지니어링과 관련된 다른 산업에서 데이터베이스에 저장된 것과는 반대로 실시간으로 발생하는 새로운 통찰력을 얻을 수있는 방법을 찾고 있습니다. 기간.

또한 부패하기 쉬운 상품 또는 부패하기 쉬운 상품이라고 부르는 데이터를 다루는 이러한 개념이 있습니다. 많은 데이터가 시간이 지남에 따라 가치를 잃는다는 것입니다. 사람들이 말하는 것과 현재 유행하는 것이 당신이 응답하고자하는 것이기 때문에 모바일 앱과 소셜 미디어 도구의 경우가 점점 더 그렇습니다. 우리가 물류 및 운송 식품을 사용하여 우리 삶의 다른 부분에 대해 생각할 때, 우리는 그런 의미에서 부패하기 쉬운 상품의 개념을 이해합니다. 그러나 조직을 통과하는 데이터와 그 가치에 대해 생각하십시오. 누군가가 지금 귀하와 비즈니스를하고 실시간으로 그들과 상호 작용할 수 있다면, 데이터를 캡처하여 Hadoop과 같은 시스템에 넣을 수 있도록이 시간을 기다리지 않고이 버튼을 누르면 지금은 처리 할 수 ​​없으며 고객의 요구에 따라 즉시 처리 할 수 ​​있기를 원합니다. 사람들이 당신에게 개인화를 제공 할 수있는이 실시간 데이터 스트림을 갖는 것에 대해 이야기하고, 개인 경험에 사용하는 시스템의 개인화 조정에 대해 이야기하는 용어가 많이 있습니다. 예를 들어 Google 검색 도구와 같은 도구를 사용할 때 쿼리를 수행하고 동일한 쿼리를 수행하면 항상 동일한 데이터를 얻지 못합니다. 우리는 본질적으로 유명 인사 경험이라고 부르는 것을 얻습니다. 나는 일회성으로 취급됩니다. 본인이 수집 한 프로필과 데이터를 기반으로 이러한 시스템에서 발생하는 상황에 대한 개인 버전을 직접 얻었으며 스트림에서 실시간으로 분석을 수행 할 수있었습니다.

부패하기 쉬운 상품이라는 데이터에 대한 아이디어는 현재 현실이며 시간이 지남에 따라 감소하는 데이터의 가치는 오늘날 다루어야 할 것입니다. 어제는 아닙니다. 나는 강에서 뛰어 내리는 연어를 잡는 곰의 그림을 좋아합니다. 왜냐하면 그것이 실제로 스트리밍 분석을 보는 것을 정확하게 칠하기 때문입니다. 이 거대한 강이 우리에게오고, 당신이 원한다면 firehose이고, 곰은 개울 한가운데에 앉아 있습니다. 주변에서 일어나는 일들에 대해 실시간 분석을 수행하여 실제로 그 물고기를 공중에서 포획하는 능력을 설계 할 수 있습니다. 스트림에 담그고 잡는 것과는 다릅니다. 이 일은 공중에서 뛰어 오르고 있으며, 그 물고기를 잡기 위해 적절한 시간에 적절한 장소에 있어야합니다. 그렇지 않으면 아침이나 점심을 먹지 않습니다.

조직은 데이터를 사용하여 동일한 작업을 수행하려고합니다. 그들은 현재 방대한 양의 데이터에서 가치를 추출하려고합니다. 그들은 그 데이터와 고속 데이터에 대한 분석을 수행하기를 원하며, 이는 우리에게 오는 데이터의 양이 아니라 그로부터 오는 속도입니다. 예를 들어 보안에서 라우터, 스위치, 서버, 방화벽 및 수십만 개의 장치가 아닌 수십만 개의 장치에서 발생하는 모든 이벤트, 일부 경우 부패하기 쉬운 데이터입니다. 사물 인터넷과 산업 인터넷에서 생각해 보면 결국 수십억 개의 센서가 아닌 수백만 개의 센서에 대해 이야기하고 있으며, 분석을 수행하는 데이터가 통과함에 따라 이제 복잡한 이벤트 처리를 검토하고 있습니다. 지금까지 본 적이없는 규모와 속도로 오늘날이 문제를 해결해야합니다. 우리는 주변에 도구와 시스템을 구축해야합니다. 한편으로는 DIY를하는 매우 큰 브랜드를 보유하고 있으며, 이를 수행 할 수있는 역량과 기술 및 엔지니어링 능력을 갖추었을 때 직접 구워내는 매우 큰 브랜드를 보유하고 있기 때문에 조직에게는 정말 어려운 과제입니다. 그러나 일반적인 조직의 경우에는 그렇지 않습니다. 스킬 세트가 없습니다. 그들은 그것을 알아낼 수있는 능력이나 시간이나 돈이 없습니다. 그들은 모두 실시간에 가까운 의사 결정이라는 개념을 목표로하고 있습니다.

내가 본 유스 케이스는 상상할 수있는 모든 부문의 모든 범위에 걸쳐 있으며 사람들이 앉아서주의를 기울이고 있다고 말합니다. 스트림 데이터에 분석을 어떻게 적용합니까? 우리는 웹 스케일 온라인 서비스에 대해 이야기합니다. 전통적인 소셜 미디어 플랫폼과 온라인 e-tailing 및 retailing이 있습니다 (예 : 앱). 그들은 모두 실시간 유명 인사 경험을 제공하려고 노력하고 있습니다. 그러나 더 많은 기술 스택 서비스, 전화 서비스, 음성 및 비디오에 익숙해지면 사람들이 전화로 FaceTime을 수행하는 것을 보았습니다. 방금 폭발하고 있습니다. 사람들이 전화를 들고 더 이상 귀를 갖지 않고 친구의 비디오 스트림과 대화하는 것이 제 마음을 아프게합니다. 그러나 그들은 그들이 할 수 있다는 것을 알고 적응하고 그 경험을 좋아했습니다. 이러한 응용 프로그램과이를 제공하는 플랫폼의 개발은 해당 트래픽과 트래픽 프로필에 대한 실시간 분석을 수행해야하므로 비디오를 완벽하게 라우팅하는 것과 같은 간단한 작업을 수행하여 음성 품질이 당신이 얻는 비디오는 좋은 경험을 얻기에 충분합니다. 그런 종류의 데이터는 일괄 처리 할 수 ​​없습니다. 실시간 비디오 스트림을 기능적인 서비스로 만들지는 않습니다.

금융 거래에는 거버넌스 문제가 있습니다. 하루가 끝날 무렵 개인 정보를 옮기는 법을 어기는 것을 알 수 없습니다. 호주에서는 프라이버시 관련 데이터를 해외로 이전하는 것이 매우 흥미로운 과제입니다. 내 개인 개인 식별 데이터 인 PID, 해외를 사용할 수 없습니다. 호주에는 그러한 일이 발생하는 것을 막기위한 법률이 있습니다. 특히 정부 서비스 및 대행사, 특히 금융 서비스 제공 업체는 데이터 스트림 및 지침에 대해 실시간 분석을 수행하여 그들이 제공하는 것이 해안을 떠나지 않도록해야합니다. 모든 것은 로컬에 있어야합니다. 그들은 실시간으로해야합니다. 그들은 법을 어 기고 나중에 용서를 구할 수 없습니다. 사기 탐지 – 우리가 신용 카드 거래에 대해 들어 본 것은 분명합니다. 그러나 우리가 금융 서비스에서 수행하는 거래 유형이 매우 빠르게 변경됨에 따라 PayPal이 돈을 움직이지 않고 실시간으로 사기를 감지하는 데 우선 현재 일종의 일이 있습니다. 시스템 간의 금융 거래. 이베이 입찰 플랫폼, 사기 탐지는 스트리밍 사무실에서 실시간으로 이루어져야합니다.

스트림에서 추출 및 변환로드 활동을 수행하는 경향이 생겨서 스트림으로 전달되는 것을 캡처하고 싶지 않습니다. 우리는 그렇게 할 수 없습니다. 사람들은 우리가 모든 것을 포착하면 데이터가 정말 빨리 깨지는 것을 좋아한다는 것을 배웠습니다. 이제 요점은 해당 스트림에 대한 분석을 수행하고 ETL을 수행하고 필요한 것, 메타 데이터를 캡처 한 다음 예측 분석을 추진하여 실제로 수행 할 수있는 부분을 알려줍니다. 방금 우리가 수행 한 분석을 기반으로 스트림에서 보았습니다.

에너지 및 유틸리티 제공 업체는 소비자의 수요 가격 책정에 대한 요구가 커지고 있습니다. 집에 혼자 있고 많은 장치를 사용하지 않기 때문에 하루 중 특정 시간에 친환경 전력을 구매하기로 결정할 수도 있습니다. 그러나 디너 파티가있는 경우 모든 장치를 켜고 싶을 수 있으며 저렴한 전력을 구매하여 배송되기를 원하지만 전력을 공급하기 위해 더 많은 비용을 지불 할 의향이 있습니다. 특히 유틸리티 및 에너지 공간에서 이러한 수요 가격이 이미 발생했습니다. 예를 들어 Uber는 매일 할 수있는 일의 전형적인 예이며 모두 수요 가격에 의해 결정됩니다. New Year 's Eve의 대규모 수요로 인해 호주 사람들이 10, 000 달러의 요금을받는 전형적인 사례가 몇 가지 있습니다. 나는 그들이 그 문제를 다룰 것이라고 확신하지만 차 안에서 지불 해야하는 금액을 알려주는 동안 실시간으로 스트림 분석이 수행됩니다.

사물 인터넷 및 센서 스트림 – 우리는 이것에 대한 표면을 긁었을뿐입니다. 그리고 우리는 이것에 대한 기본적인 대화를했지만 기술을 다루는 방식에 흥미로운 변화가있을 것입니다. 약 수천 또는 수만, 수십만 및 잠재적으로 수십억 개의 장치가 사용자에게 스트리밍됩니다. 현재 우리가 보유한 기술 스택은 그에 대처하도록 설계되지 않았습니다.

보안 및 사이버 위험과 같은 곳에서 우리가 보게 될 몇 가지 뜨거운 주제가 있습니다. 그들은 우리에게 매우 어려운 과제입니다. 웹에는 North라는 정말 깔끔한 도구가 있으며이를 통해 웹 페이지에서 실시간으로 발생하는 다양한 사이버 공격을 볼 수 있습니다. 당신이 그것을 볼 때, 당신은“아, 그것은 아주 귀여운 작은 웹 페이지라고 생각합니다.”약 5 분 후에, 당신은 시스템이 전 세계의 모든 다른 장치의 모든 다른 스트림에서 분석을 수행하는 데이터의 양을 깨닫습니다. 그들에게 먹이를주고 있습니다. 그것은 그들이 기록의 가장자리에서 어떻게 그것을 수행하고 있는지에 대한 마음을 사로 잡기 시작하며 실시간으로 공격하는 것과 무엇을 공격하고 어떤 유형의 공격을 알려주는 간단한 작은 화면을 제공합니다. 그러나이 페이지를보고 스트림의 볼륨과 문제를 파악하고 분석 쿼리를 처리하는 것만으로도 스트림 분석이 잠재적으로 실시간으로 수행 할 수있는 작업을 제대로 맛볼 수있는 아주 깔끔한 방법입니다. 그것들을 실시간으로 표현합니다.

세션의 나머지 부분에서 제가 가지고있는 대화는 제 관점에서 볼 때 하나의 흥미로운 관점으로 그러한 모든 유형의 사물을 다룰 것이라고 생각합니다. 그것이 DIY의 도전이며, 직접 구워서, 일부는 그런 종류의 물건을 만들 여유가있는 클래식 유니콘. 이 엔지니어링 팀을 구축하고 데이터 센터를 구축하는 데 수십억 달러가 있습니다. 그러나 스트림 분석 비즈니스에서 가치를 창출하려는 조직의 99.9 %는 상용 서비스를 받아야합니다. 그들은 즉시 제품을 구입해야하며 일반적으로 제품을 구현하는 데 도움이되는 컨설팅 서비스와 전문 서비스가 필요하며 비즈니스에서 그 가치를 되찾아 비즈니스에 다시 솔루션으로 판매합니다.

이것으로, 우리가 지금 여러분에게 다시 이야기 할 것입니다. 저는 이것이 우리가 지금 자세히 다룰 것이라고 믿고 있기 때문입니다.

Rebecca Jozwiak : 훌륭합니다. 정말 감사합니다, 데즈 훌륭한 프리젠 테이션입니다.

이제 공을 로빈에게 넘기겠습니다. 멀리 가져.

로빈 블로어 : 알겠습니다. Dez는 스트림 처리의 핵심적인 문제에 빠졌기 때문에 다시 다루는 것이 의미가 없었습니다. 저는 완전히 전략적인 견해를 보려고합니다. 도대체 어떤 일이 벌어지고 있는지에 대해 매우 높은 수준에서 살펴보면, 특히 사람들에게 도움을 줄 수 있다고 생각하기 때문에 포지셔닝은 매우 중요합니다.

스트림 처리는 오랫동안 사용되어 왔습니다. 우리는 그것을 CEP라고 불렀습니다. 그 전에는 실시간 시스템이있었습니다. 원래의 프로세스 제어 시스템은 실제로 정보 스트림을 처리하고있었습니다. 물론 오늘날까지는 아무 것도 진행되지 않았습니다. 여기 슬라이드에서 볼 수있는이 그래픽; 실제로 많은 것들을 지적하고 있지만, 다른 무엇보다 위를 지적하고 있습니다-여기에 다른 색상으로 나타나는 대기 시간 스펙트럼이 있다는 사실. 1960 년경에 도착한 컴퓨팅 또는 상업용 컴퓨팅의 발명 이후 실제로 일어난 일은 모든 것이 더 빠르고 빨라 졌다는 것입니다. 우리는 당신이 파도에서 좋아한다면 이것이 실제로 나오는 방식에 의존 할 수있었습니다. 왜냐하면 그것이 모양입니다. 이것은 실제로 그것에 달려 있습니다. 그것은 모두 무어의 법칙에 의해 좌우 되었기 때문에 무어의 법칙은 약 6 년 동안 약 10 배의 속도를 줄 것입니다. 우리가 실제로 2013 년쯤되면 모든 것이 무너졌고, 우리는 전례없는 속도로 갑자기 가속하기 시작했습니다. 속도가 증가하고 약 6 년마다 지연 시간이 감소한다는 점에서 약 10 배의 요소를 얻었습니다. 2010 년 이후 6 년 동안 우리는 최소한 천의 배수를 얻었습니다. 하나가 아닌 세 자릿수.

그것이 진행되고있는 것이기 때문에, 어떤 방식 으로든 산업이 환상적인 속도로 움직이는 것처럼 보입니다. 이 특정 그래픽의 의미를 살펴보면 응답 시간은 실제로 수직 축에서 알고리즘으로 축소됩니다. 실시간은 인간보다 빠른 컴퓨터 속도입니다. 대화 형 시간은 주황색입니다. 대기 시간이 10 분에서 1 초 정도 인 컴퓨터와 상호 작용할 때입니다. 위, 컴퓨터에서 실제로하고있는 일에 대해 실제로 생각하는 트랜잭션이 있지만, 약 15 초 안에 사라지면 참을 수 없게됩니다. 사람들은 실제로 컴퓨터를 기다리지 않을 것입니다. 모든 것이 일괄 처리되었습니다. 일괄 처리 된 많은 작업이 이제 트랜잭션 공간, 대화 형 공간 또는 실시간 공간으로 내려갑니다. 이전에는 매우 적은 양의 데이터로 물결 모양의 데이터를 처리 할 수 ​​있었지만 이제는 대규모로 확장 된 환경을 사용하여 매우 많은 양의 데이터를 처리 할 수 ​​있습니다.

기본적으로이 모든 것은 실제로 거래와 대화 형 인간 반응 시간입니다. 현재 스트림으로 수행되고있는 끔찍한 일은 사람들에게 사물에 대해 알리는 것입니다. 그것의 일부는 그것보다 빠르며 물건을 잘 알려주므로 실시간입니다. 그런 다음 즉시 분석을 수행 할 수있는 라이센스를 가져와 즉각적인 분석이 가능하고 우연히 이루어집니다. 속도가 떨어졌을뿐 아니라 상단도 무너졌습니다. 다양한 응용 프로그램 중에서 이러한 응용 프로그램에 가장 큰 영향을 주었을 때 이러한 모든 예측 분석을 수행 할 수 있습니다. 잠시 후 이유를 알려 드리겠습니다.

이것은 단지 하드웨어 저장소입니다. 병렬 소프트웨어가 있습니다. 스케일 아웃 아키텍처, 멀티 코어 칩, 메모리 증가, 구성 가능한 CPU. SSD는 이제 디스크 회전보다 훨씬 빠릅니다. 당신은 거의 디스크 회전 디스크 작별 인사를 할 수 있습니다. SSD는 여러 코어에도 있으므로 더 빠르고 빠릅니다. 곧 HP에서 멤 리스터를 얻었습니다. 우리는 Intel과 Micron으로부터 3D XPoint를 얻었습니다. 그 약속은 어쨌든 모든 것이 더 빠르고 더 빨라질 것입니다. 실제로 두 가지 새로운 메모리 기술을 생각할 때, 둘 다 기본 작은 조각 전체를 만들 것이므로 개별 회로 보드가 더 빨리 진행됩니다. 우리는 그 끝을 보지 못했습니다.

다음 메시지 인 Streams 기술이 여기에 있습니다. 새로운 아키텍처가 있어야합니다. 데즈가 프레젠테이션에서 몇 가지 점에서 이것을 언급했음을 의미합니다. 수십 년 동안 우리는 아키텍처를 데이터 힙과 데이터 파이프의 조합으로 간주했습니다. 우리는 힙을 처리하는 경향이 있었고 힙 사이에 데이터를 파이프하는 경향이있었습니다. 이제는 데이터 흐름 처리와 데이터 힙을 결합한 Lambda 데이터 아키텍처로 근본적으로 이동하고 있습니다. 히스토리 데이터에 대해 들어오는 데이터 스트림을 데이터 플로우 또는 데이터 힙으로 실제로 처리 할 때 이것이 바로 Lambda 아키텍처의 의미입니다. 이것은 초기 단계입니다. 사진의 일부일뿐입니다. Dez가 언급 한 모든 것의 인터넷과 같이 복잡한 것을 고려하면 실제로 스트림에서 처리해야 할 사항에 대한 결정 인 모든 종류의 데이터 위치 문제가 있음을 알 수 있습니다.

여기서 실제로 말하는 것은 일괄 처리 할 때 실제로 스트림을 처리하고 있다는 것입니다. 한 번에 하나씩 할 수 없었습니다. 우리는 많은 자료가 쌓일 때까지 기다렸다가 한 번에 처리합니다. 우리는 실제로 스트림에서 물건을 처리 할 수있는 상황으로 이동하고 있습니다. 스트림에서 자료를 처리 할 수 ​​있으면 보유한 데이터 힙은 스트림에서 데이터를 처리하기 위해 참조해야하는 정적 데이터가됩니다.

이것은 우리를이 특별한 것에 데려갑니다. 나는 생물학적 비유에 대한 프레젠테이션에서 이것을 언급했습니다. 여러분이 생각하고 싶은 방식은 우리가 인간 인 순간입니다. 실시간 예측 처리를위한 세 가지 고유 한 네트워크가 있습니다. 그들은 체세포, 자율 및 장이라고합니다. 장은 당신의 위입니다. 자율 신경계는 싸움과 비행을 돌 봅니다. 실제로 환경에 대한 빠른 반응을 돌 봅니다. 몸의 움직임을 돌보는 체감. 그것들은 실시간 시스템입니다. 그것에 관해 흥미로운 점은 – 또는 내가 흥미 롭다고 생각하는 것 – 여러분이 상상했던 것보다 훨씬 더 예측 적입니다. 마치 마치 얼굴에서 약 18 인치 정도 화면을 보는 것처럼 보입니다. 당신이 명확하게 볼 수있는 모든 것, 당신의 몸이 명확하게 볼 수있는 모든 것은 실제로 8 × 10 사각형에 관한 것입니다. 그 밖의 모든 것은 실제로 몸에 관한 한 흐릿하지만 마음은 실제로 간격을 채우고 흐려지지 않습니다. 흐릿함이 전혀 보이지 않습니다. 당신은 그것을 명확하게 볼 수 있습니다. 당신의 마음은 실제로 그 명확성을보기 위해 데이터 스트림의 예측 방법을하고 있습니다. 그것은 호기심 많은 일이지만 실제로 신경계가 작동하는 방식과 우리가 적어도 우리 중 일부는 합리적으로 산만하고 사물에 부딪치지 않고 합리적으로 행동하고 행동하는 방식을 볼 수 있습니다.

모든 것은 여기에 일련의 신경 분석 척도에 의해 이루어집니다. 앞으로 일어날 일은 조직이 같은 종류의 것을 가질 것이고 같은 종류의 것을 구축 할 것이며 조직의 내부 스트림을 포함한 스트림의 처리가 될 것입니다. 외부에서 일어나는 일들, 실제로 이루어져야하는 즉각적인 반응은 물론 인간에게 결정을 내리고, 모든 일이 일어나도록합니다. 내가 볼 수있는 한 우리가 가고있는 곳입니다.

그 결과로 발생하는 것 중 하나는 스트리밍 응용 프로그램의 수준이 잘 돌아가고 있다는 것입니다. 우리가 지금 보는 것보다 훨씬 더 많은 것들이있을 것입니다. 지금, 우리는 명백한 일을 행하는 저조한 열매를 고르고 있습니다.

어쨌든 그것이 결론입니다. 스트리밍 분석은 한 번 틈새 시장 이었지만 주류가되었으며 곧 일반적으로 채택 될 것입니다.

그것으로, 나는 그것을 Rebecca에게 다시 전달할 것입니다.

Rebecca Jozwiak : 감사합니다, Robin. 평소와 같이 훌륭한 프레젠테이션.

아난드, 당신은 다음에 있습니다. 바닥은 당신입니다.

아난드 Venugopal : 환상적인. 감사합니다.

저는 Anand Venugopal이고 StreamAnalytix의 제품 책임자입니다. 캘리포니아 Los Gatos에서 Impetus Technologies가 제공하는 제품입니다.

Impetus는 실제로 대기업을위한 빅 데이터 솔루션 제공 업체로서 큰 역사를 가지고 있습니다. 실제로 서비스 회사로서 수많은 스트리밍 분석 구현을 수행했으며 많은 교훈을 얻었습니다. 또한 지난 몇 년 동안 제품 회사 및 솔루션 중심 회사로 전환했으며 스트림 분석은 Impetus를 대규모 제품 중심 회사로 전환하는 데 책임을지고 있습니다. 기업에 대한 노출로 Impetus가 정리 한 중요하고 매우 중요한 자산이 있으며 StreamAnalytix도 그 중 하나입니다.

우리는 20 년 동안 사업을 운영해 왔으며 제품과 서비스가 혼합되어 큰 이점을 제공합니다. StreamAnalytix는 스트리밍의 첫 5 ~ 6 가지 구현에서 배운 모든 교훈에서 나왔습니다.

몇 가지 사항을 다루지 만 분석가 Dez와 Robin은 전체 공간을 덮는 환상적인 작업을 수행하여 중복되는 내용을 많이 건너 뛸 것입니다. 아마 빨리 갈거야. 기업에서 문자 그대로 매우 중요한 배치 프로세스가있는 배치 가속을 사용하는 진정한 스트리밍 사례 외에도 볼 수 있습니다. 보시다시피, 이벤트 감지 및 분석 및 조치의 전체주기는 실제로 대기업에서 몇 주가 소요될 수 있으며 모두 몇 분, 때로는 몇 초 및 밀리 초로 축소하려고합니다. 따라서 모든 배치 프로세스보다 빠른 것은 비즈니스 인수 후보이며 데이터의 가치는 나이가 들어감에 따라 급격히 줄어들 기 때문에 처음 몇 초 만에 더 많은 가치가 있습니다. 이상적으로는 무슨 일이 일어날 지 예측할 수 있다면 이것이 가장 높은 가치이며 정확도에 달려 있습니다. 다음으로 가장 높은 가치는 그것이 일어날 때 바로 거기에있을 때이를 분석하고 대응할 수 있다는 것입니다. 물론 그 이후로 가치가 크게 줄어 듭니다. 주요 제한적 BI입니다.

흥미 롭군. 스트리밍 분석이 필요한 이유에 대한 과학적인 답변을 기대할 수 있습니다. 많은 경우에, 우리가보고있는 것은 그것이 가능하기 때문이며 모든 사람들이 배치가 오래되었다는 것을 알고 있기 때문에 배치는 지루하고 배치는 시원하지 않습니다. 스트리밍이 가능하고 모든 사람들이 지금 하둡을 가지고 있다는 사실에 대해 모든 사람들이 지금까지 충분한 교육을 받았습니다. 이제 Hadoop 배포판에는 Storm 또는 Spark 스트리밍이든 물론 Kafka와 같은 메시지 대기열이든 스트리밍 기술이 포함되어 있습니다.

우리가보고있는 기업은 이에 뛰어 들어 이러한 사례를 실험하기 시작했으며 두 가지 광범위한 범주를보고 있습니다. 하나는 고객 분석 및 고객 경험 및 두 번째 운영 인텔리전스와 관련이 있습니다. 나는 이것에 대한 세부 사항들에 대해 조금 나중에 살펴볼 것이다. 전체 고객 서비스 및 고객 경험 각도와 Impetus StreamAnalytix에서 우리는 여러 가지 방식으로이 작업을 수행했습니다. 실제로 소비자의 멀티 채널 참여를 실시간으로 캡처하고 매우 상황에 맞는 경험을 제공합니다. 오늘날 일반적이지 않습니다. 웹, Bank of America 웹 사이트에서 탐색 중이고 일부 제품을 조사하고 있는데 콜 센터에 전화하면됩니다. "이봐 요, 조, 당신은 은행 상품을 조사하고 있다는 것을 알고 있습니다. 당신을 채워 주실 래요?"오늘은 그럴 것이라고 생각하지는 않지만 스트리밍 분석에서 실제로 가능한 종류의 경험입니다. 많은 경우에, 특히 고객이 웹 사이트에서 조기 해지 조항 또는 조기 해지 조건을 조사하여 계약을 해지하는 방법을 연구하기 시작한 경우 전화를 걸면 큰 차이가 있습니다. 시스템이이 사람이 조기 종료를보고 있음을 알고 그 시점에서 해당 제안을하는 것을 알고 있기 때문에 직접 프로모션에 대해 직접 대면하지만 일종의 첫 번째 프로모션에 대해 간접적으로 제안하는 경우 해당 고객을 매우 잘 보호하고 자산을 보호 할 수 있습니다 .

그것은 하나의 예일뿐 아니라, 많은 고객 서비스가 모두 좋은 예입니다. 우리는 오늘 구현하여 콜센터의 비용을 낮추고 극적인 즐거운 고객 경험을 제공합니다. Dez는 일부 사용 사례를 요약하는 데 큰 역할을했습니다. 이 차트를 몇 분 동안 응시할 수 있습니다. 나는 수직, 수평 및 콤보 영역, IoT, 모바일 앱 및 콜 센터로 분류했습니다. 그것들은 모두 수직과 수평입니다. 당신이 그것을 어떻게 보는가에 달려 있습니다. 결론적으로, 우리는 산업 분야에서 상당히 일반적인 수평 용도를 많이 보았고 금융 서비스, 건강 관리, 통신, 제조 등 수직적 인 특정 사용 사례가 있습니다. 실제로 자신에게 질문을하거나 자신에게 이야기하는 경우 “오, 어떤 유스 케이스가 있는지 모르겠습니다. 회사 나 기업을위한 스트리밍 분석에 실제로 비즈니스 가치가 있는지 확실하지 않습니다.”라고 열심히 생각하고 두 번 생각하십시오. 오늘날 회사와 관련이있는 사용 사례가 있기 때문에 더 많은 사람들과 대화하십시오. 비즈니스 가치가 정확히 어떻게 도출되는지에 대한 비즈니스 가치를 살펴 보겠습니다.

피라미드의 맨 아래에는 예측 유지 관리, 보안, 이탈 방지 등이 있습니다. 이러한 사용 사례는 수익 및 자산 보호를 구성합니다. Target이 몇 시간과 몇 주에 걸쳐 발생한 보안 침해를 보호했다면 CIO가 작업을 저장했을 수 있습니다. 실시간 스트리밍 분석은 이러한 자산을 보호하고 손실을 방지하는 데 실제로 도움이됩니다. 그것은 바로 직접적인 비즈니스 가치입니다.

다음 카테고리는 수익성이 높아져서 비용을 낮추고 현재 운영에서 더 많은 수익을 창출합니다. 이것이 현재 기업의 효율성입니다. 이들은 네트워크 작동 방식, 고객 운영 작동 방식, 비즈니스 프로세스 작동 방식 및 조정 방법에 대한 심층적 인 통찰력을 얻는 실시간 운영 인텔리전스라고하는 모든 사용 사례 범주입니다. 피드백을 받으면 실시간으로 알림을받습니다. 실시간으로 편차, 편차를 얻을 수 있으며 한계를 벗어나는 프로세스를 신속하게 수행하고 분리 할 수 ​​있습니다.

또한 고가의 자본 업그레이드 및 네트워크 서비스를 최적화 할 경우 필요하지 않은 필요하다고 생각되는 것들로 많은 돈을 절약 할 수 있습니다. 우리는 주요 통신 회사가 현재 트래픽을 관리 할 수있는 충분한 용량이 있음을 발견했기 때문에 네트워크 인프라에서 4 천만 달러 업그레이드를 연기 한 사례를 들었습니다. 이는 트래픽과 그와 같은 것들의 지능적인 라우팅을 최적화하고 더 잘 수행함으로써 가능합니다. 이러한 통찰력은 실시간으로 통찰력에 작용하는 실시간 분석 및 행동 메커니즘을 통해서만 가능합니다.

다음 단계의 부가 가치는 현재 판매로 더 많은 수익과 수익을 올릴 기회가있는 상향 판매, 교차 판매입니다. 이것은 오늘날 많은 사람들이 경험 한 바에 대해 알고있는 전형적인 예입니다. 여러분이 실제로 제공하지 않는 제품을 실제로 구매하고자하는 곳에서 생각합니다. 많은 경우에 실제로 그런 일이 발생합니다. 당신은 당신이 사고 싶은 것들, 당신이 사고 싶은 것을 알고, 할 일 목록이나 무언가가 있거나, 아내가 당신에게 말했거나 아내가 없지만 실제로 사고 싶어했다면 그리고 당신은 웹 사이트에서 쇼핑을하거나 소매점에서 상호 작용을하는데, 상점 첫 화면에는 상황이없고, 필요한 것을 계산할 정보가 없습니다. 따라서 그들은 사업을 안전하게하지 못한다. 실제로 정확한 예측을하기 위해 스트리밍 분석을 배포 할 수 있고이 특정 상황에 가장 적합한 것에 대해 실제로 가능한 경우, 현재이 고객은이 지역에 많은 업셀 및 크로스 셀이 있으며 다시 스트리밍 분석 – 기회가있을 때이 순간에이 고객이 구매하거나 응답 할 가능성에 대한 성향 결정을 내릴 수 있습니다. 그렇기 때문에 데즈가 곰과 함께 물고기를 먹기 위해 보여준 그림을 좋아합니다. 거의 다됐다.

우리는 또한 단순히 고객 행동의 관찰에 기초한 완전히 새로운 제품과 서비스를 다른 기업의 행동에 대한 관찰에 기초하여 완전히 새로운 제품과 서비스를 제공하는 기업에 극적인 변화가 큰 범주가 있다고 생각합니다. 예를 들어, 통신 회사 또는 케이블 회사가보고있는 시장의 세그먼트, 시간 등의 프로그램에서 고객의 사용 패턴을 실제로 관찰하면 실제로 거의 구걸하는 제품과 서비스를 만들게됩니다. 어떤 식 으로든. 따라서 멀티 스크린 동작의 전체 개념은 현재 모바일 앱에서 TV 또는 케이블 콘텐츠를 볼 수 있다는 점을 감안할 때 거의 모든 상황에 적용됩니다. 이러한 예 중 일부는 우리에게 제공되는 새로운 제품 및 서비스에서 나옵니다.

“스트리밍 분석의 아키텍처 고려 사항은 무엇입니까?”에 대해 살펴 보겠습니다. 궁극적으로 우리가 시도하는 것입니다. 이것은 기록 데이터와 실시간 통찰력을 혼합하고 동시에 보는 Lambda 아키텍처입니다. 이것이 시그마가 가능하게하는 것입니다. 오늘날 모두 배치 아키텍처와 엔터프라이즈 사진을 보유하고 있습니다. 우리는 일종의 BI 스택 및 활용 스택을 모으고 있으며 Lambda 아키텍처가 추가되었습니다. 속도 계층이나 필요 및 Lambda는이 두 가지 통찰력을 통합하고이를 두 가지 통찰력을 결합한 풍부한 방식으로 결합 된 방식으로 보는 것입니다.

Kappa 아키텍처라는 또 다른 패러다임이 있는데, 속도 계층이 장기적으로 지속될 유일한 입력 메커니즘이라는 추측이 있습니다. 모든 것이이 스피드 레이어를 통과 할 것입니다. 오프라인 ETL 메커니즘도 없을 것입니다. 모든 ETL이 발생합니다. 정리, 데이터 정리, 품질 ETL – 모든 데이터가 실시간으로 생성되므로 염두에 두어야합니다. 언젠가는 실시간이었습니다. 우리는 이것을 호수, 강 및 바다에 놓고 정적 분석을 수행하여 데이터가 실시간으로 생성되었다는 것을 잊어 버렸습니다. 모든 데이터는 실제로 실시간 이벤트로 생성되었으며 현재 호수에있는 대부분의 데이터는 나중에 분석을 위해 데이터베이스에 저장되었으며 이제 Lambda 및 Kappa 아키텍처에서 실제로 이점을 얻습니다. 보고, 분석하고, 전처리하고 도착하자마자 반응합니다. 이것이 이러한 기술에 의해 가능해집니다. 전체적인 그림으로 볼 때, 하둡이있는 곳, MPP 및 이미 가지고있는 데이터웨어 하우스가있는 곳은 다음과 같습니다.

우리는 섬의 새로운 기술에 대해서만 이야기하는 것이 중요하지 않기 때문에 이것을 넣었습니다. 통합해야합니다. 이들은 현재 엔터프라이즈 환경에서 의미가 있어야하며 엔터프라이즈를 제공하는 솔루션 제공 업체로서 이에 매우 민감합니다. 우리는 기업이 모든 것을 통합하도록 돕습니다. 왼쪽에는 Hadoop 및 데이터웨어 하우스 계층과 실시간 계층에 데이터 소스가 있으며 각 엔터티는 재고 컴퓨터이며 데이터 소비 계층은 오른쪽에 있습니다. 측면. 대부분의 규정 준수, 거버넌스, 보안, 수명주기 관리 등을 이동시키려는 끊임없는 노력이 있으며, 오늘날 이용 가능한 모든 것이이 새로운 기술에 축적되었습니다.

스트림 분석이 수행하려는 작업 중 하나 인 오늘날의 환경을 살펴보면 스트리밍 기술 환경에서 많은 일이 진행되고 있으며 엔터프라이즈 고객의 관점에서 볼 때 이해해야 할 것이 많습니다. 따라야 할 것이 너무 많습니다. 왼쪽에는 NiFi, Logstash, Flume, Sqoop과 같은 데이터 수집 메커니즘이 있습니다. 분명히, 나는 그것이 철저하지 않다는 면책 조항을 작성했습니다. 메시지 대기열로 들어온 다음 오픈 소스 스트리밍 엔진 (Storm, Spark Streaming, Samza, Flink, Apex, Heron)으로 들어옵니다. 헤론은 아직 오픈 소스가 아닐 것입니다. 그것이 Twitter인지 확실하지 않습니다. 그런 다음 스트리밍 엔진은 복잡한 이벤트 처리, 머신 러닝, 예측 분석, 경고 모듈, 스트리밍 ETL, 보강 통계 작업 필터와 같은 설정 분석 응용 프로그램 구성 요소로 연결되거나이를 지원합니다. 그것들을 우리는 지금 연산자라고 부릅니다. 함께 묶일 때 이러한 연산자 세트는 필요한 경우 스트리밍 엔진에서 실행되는 스트리밍 응용 프로그램이 될 수 있다고 대부분 사용자 정의 할 수 있습니다.

해당 구성 요소 체인의 일부로 데이터를 즐겨 사용하는 데이터베이스 인 즐겨 사용하는 인덱스에 저장하고 인덱싱해야합니다. 캐시를 다시 배포해야 할 수도 있으며, 이로 인해 상단 오른쪽의 데이터 시각화 계층이 상용 제품 또는 오픈 소스 제품으로 이어질 수 있지만 궁극적으로 해당 데이터를 실시간으로 시각화하려면 일종의 제품이 필요합니다. 또한 때때로 다른 응용 프로그램을 파악해야합니다. 우리는 모두 통찰력에 취한 행동에 의해서만 도출 된 가치, 그 행동이 분석 스택에서 다른 애플리케이션 스택으로의 트리거가 될 수 있음을 보았습니다. 이는 IVR 측에서 변경되거나 콜 센터를 트리거합니다. 발신 전화 또는 이와 유사한 것. 이러한 시스템을 통합하고 스트리밍 클러스터가 다른 애플리케이션에서 다운 스트림으로 데이터를 전송하도록 트리거 할 수있는 메커니즘이 필요합니다.

그것은 왼쪽에서 오른쪽으로가는 전체 스택입니다. 그런 다음 서비스 계층, 중간 모니터링, 보안 일반 서비스 계층 등이 있습니다. 엔터프라이즈 영역에서 고객이보고있는 것처럼 하둡 배포판과 같이 어떤 제품이 나오는지, 상용 또는 단일 우리의 경쟁 업체에 분명히 존재하는 벤더 솔루션. 우리가 여기서 언급하지 않은 풍경에는 ​​더 많은 것이 있습니다.

현재보고있는 것은 엔터프라이즈 사용자가 광범위하게보고있는 것입니다. 보시다시피 스트림 처리를위한 복잡하고 빠르게 발전하는 기술 환경. 선택과 사용자 경험을 단순화해야합니다. 기업이 실제로 필요로하는 것은 원 스톱 상점에서 사용하기 쉬운 인터페이스에있는 모든 기능을 추상화 한 것입니다. 사용하기 쉬운 인터페이스를 통해 사용이 간편하고 모든 움직이는 부품을 노출시키지 않는 모든 기술을 통합합니다. 그리고 기업에 대한 성능 저하 문제 및 성능 문제 및 수명주기 유지 관리 문제.

기능 추상화는 하나입니다. 두 번째 부분은 스트리밍 엔진 추상화입니다. 스트리밍 엔진과 오픈 소스 도메인은 현재 3 개월, 4 개월 또는 6 개월에 한 번씩 등장합니다. 오랫동안 폭풍이었습니다. Samza가 나타 났고 이제 Spark Streaming입니다. Flink는 주목을 받기 시작하면서 고개를 들었습니다. Spark Streaming 로드맵조차도 Pure는 이벤트 처리에 다른 엔진을 사용할 수있는 방법을 만들고 있습니다. 또한 Spark는 배치 용으로 설계되었으며 잠재적으로 다른 비전을 갖기위한 아키텍처 비전과 로드맵을 구현하고 있기 때문입니다. Spark Streaming의 현재 마이크로 배치 패턴 외에 스트림 처리 용 엔진.

많은 진화가있을 것이라는 점에 맞서야합니다. 기술 플럭스로부터 자신을 보호해야합니다. 기본적으로, 하나를 골라서 살아야하므로 최적이 아닙니다. 다른 방식으로 살펴보면“좋아요. 저는 잠금 장치가없고 오픈 소스의 레버리지가없는 독점 플랫폼을 구입해야하므로 비용이 매우 높고 제한적일 수 있습니다. 유연성은 여러분이 직접해야하는 모든 오픈 소스 스택과 비교할 수 있습니다.”다시 말했듯이, 시장 출시에 많은 비용과 지연이 있습니다. 우리가 말하는 것은 StreamAnalytix는 엔터프라이즈 급, 신뢰할 수있는 단일 공급 업체, 전문 서비스 지원을 모두 제공하는 훌륭한 플랫폼의 한 예입니다. 실제로 기업으로서 필요한 모든 것 및 오픈 소스 생태계의 유연성 하나의 플랫폼으로 인제 스트 (Ingest), CEP, 분석, 시각화 및 그 모두를 통합합니다.

또한 매우 독창적 인 작업을 수행하여 하나의 단일 사용자 환경 아래에 다양한 기술 엔진을 통합합니다. 우리는 미래에 여러 스트리밍 엔진을 사용할 수있게 될 것이라고 생각합니다. 사용 사례마다 실제로 다른 스트리밍 아키텍처가 필요하기 때문입니다. Robin이 말했듯이, 모든 지연 시간이 있습니다. 실제로 밀리 초 대기 시간 수준, 수십 또는 수백 밀리 초에 대해 이야기하는 경우, 덜 현명하거나 시간이 덜 걸리는 대기 시간과 대기 시간이 몇 초, 3, 3 분의 1, 3, 3, 4 초, 5 초, 그 범위가되면 스파크 스트리밍을 사용할 수 있습니다. 잠재적으로 두 가지를 모두 수행 할 수있는 다른 엔진이 있습니다. 결론적으로, 대기업에서는 모든 종류의 사용 사례가있을 것입니다. 액세스와 일반성이 하나의 사용자 경험을 가진 여러 엔진을 갖기를 원하며 이것이 바로 StreamAnalytix에서 구축하려는 것입니다.

아키텍처를 간단히 살펴보십시오. 우리는 이것을 약간 재 작업 할 것입니다. 그러나 기본적으로 왼쪽에는 Kafka, RabbitMQ, Kinesis, ActiveMQ와 같은 여러 데이터 소스가 있습니다. 모든 데이터 소스와 메시지 큐는 스트림 처리 플랫폼으로 들어옵니다. 우리가 이야기했던 모든 것들을 ETL과 같은 연산자에서 끌어다 놓을 수있는 앱을 조립하게됩니다. 그 아래에는 여러 엔진이 있습니다. 현재 우리는 여러 엔진을 지원하는 업계 최초이자 엔터프라이즈 급 스트리밍 플랫폼으로 Storm and Spark Streaming을 보유하고 있습니다. 이는 실시간 대시 보드를 보유 할 수있는 다른 모든 유연성 외에 우리가 제공하는 매우 독창적이고 유연성입니다. CET 엔진 내장 Hadoop 및 NoSQL 인덱스, Solr 및 Apache 인덱스와 완벽하게 통합되었습니다. 원하는 데이터베이스에 관계없이 원하는 데이터베이스에 착륙하여 애플리케이션을 신속하게 구축하고 시장에 빠르게 출시하고 미래의 증거를 유지할 수 있습니다. 이것이 바로 StreamAnalytix의 모든 진언입니다.

그것으로, 나는 내 발언을 결론 지을 것이라고 생각합니다. 더 궁금한 점이 있으면 언제든지 문의하십시오. Q & A 및 패널 토론을 위해 플로어를 개방하고 싶습니다.

레베카, 너에게

Rebecca Jozwiak : 좋습니다. 정말 고맙습니다. Dez와 Robin, 청중 Q & A에게 넘겨주기 전에 질문이 있습니까?

로빈 블로어 : 질문이 있습니다. 내가들을 수 있도록 헤드폰을 다시 착용하겠습니다. 흥미로운 점 중 하나는, 당신이 친절하게 이것을 말해 줄 수 있다면, 오픈 소스 공간에서 내가 본 많은 것들이 내가 미숙하다고 말할 것입니다. 어떤 의미에서, 당신은 다양한 일을 할 수 있습니다. 하지만 실제로 첫 번째 또는 두 번째 릴리스에서 소프트웨어를보고있는 것처럼 보이며 조직으로서의 경험에 대해 궁금합니다. Hadoop 환경의 미숙함을 문제가있는 것으로 보거나 그렇지 않은 것입니다. t 문제가 너무 많습니까?

Anand Venugopal : 현실입니다, Robin. 당신 말이 맞아요 미성숙은 반드시 기능적 안정성과 사물의 영역에있을 필요는 없지만, 아마도 일부 경우 일 수도 있습니다. 그러나 미성숙은 사용 준비가 더되어 있습니다. 오픈 소스 제품이 출시 될 때와 하둡 배포판에서 제공하는 제품 일지라도 서로 다른 기능을 갖춘 많은 제품이며 구성 요소가 서로 맞물려 있습니다. 이들은 원활하게 함께 작동하지 않으며 Bank of America, Verizon 또는 AT & T와 같이 원활하고 원활한 사용자 경험을 위해 설계되어 몇 주 내에 스트리밍 분석 응용 프로그램을 배포 할 수 없습니다. 그들은 그것을 위해 설계된 것이 아닙니다. 그것이 우리가 들어온 이유입니다. 우리는 그것을 모아서 이해하고 배포하기가 정말 쉬워졌습니다.

그것의 기능적 성숙도는 크게 생각합니다. 오늘날 많은 대기업에서 Storm을 사용합니다. 오늘날 많은 대기업에서 Spark Streaming을 사용하고 있습니다. 각 엔진마다 수행 할 수있는 작업에 제한이 있으므로 각 엔진으로 수행 할 수없는 작업과 수행 할 수없는 작업을 아는 것이 중요하며 벽에 머리를 대고 말을 할 필요가 없습니다. Spark Streaming을 선택했는데이 특정 산업에서는 작동하지 않습니다. " Spark Streaming이 최선의 선택이 될 유스 케이스가 있고 Spark Streaming이 전혀 작동하지 않을 수있는 유스 케이스가 있습니다. 그렇기 때문에 실제로 여러 옵션이 필요합니다.

Robin Bloor : 대부분의 경우 전문가 팀이 필요합니다. 나는 어디서부터 시작 해야할지조차 모른다는 것을 의미합니다. 숙련 된 개인의 합리적인 협력. 귀하의 참여와 참여 방식에 관심이 있습니다. 특정 회사가 특정 응용 프로그램을 따르거나 전체 플랫폼이 많은 일을하기를 원하는 전략적 채택이라고 생각하기 때문입니까?

Anand Venugopal : 우리는 둘 다의 예를보고 있습니다. Robin. 모두가 알고있는 상위 10 개 브랜드 중 일부는 매우 전략적인 방식으로 진행되고 있습니다. 그들은 다양한 유스 케이스를 갖게 될 것이라는 것을 알고 있으므로 기업에 배치 할 다중 테넌트 방식의 다양한 유스 케이스 인 그 요구에 맞는 플랫폼을 평가하고 있습니다. 시작하는 단일 사용 사례도 있습니다. 모기지 회사에는 특정 비즈니스 활동 모니터링 유형 유스 케이스가 있습니다. 모기지 회사에서는 첫 번째 유스 케이스로 상상하지 못하지만 비즈니스 솔루션 또는 유스 케이스가 떠오른 다음 점을 스트리밍에 연결했습니다. . 우리는“무엇을 알고 있습니까? 이는 스트리밍 분석의 좋은 사례이며이를 구현할 수있는 방법입니다.”이것이 바로 시작이었습니다. 그런 다음, 그 과정에서 그들은 교육을 받고 말합니다.“아, 우리가 이것을 할 수 있고 이것이 일반적인 플랫폼이라면, 우리는 응용 프로그램을 분리하고 플랫폼으로 계층화하고 이것에 대해 많은 다른 응용 프로그램을 만들 수 있습니다 플랫폼."

로빈 블로어 : 데즈, 질문 있어요?

Anand Venugopal : Dez가 음소거 상태 일 수 있습니다.

Dez Blanchfield : 사과, 음소거. 나는 방금 좋은 대화를 나 had습니다. Robin의 원래 관찰에 따르면, 당신은 절대적으로 맞습니다. 지금 도전 과제는 기업에 무료 및 오픈 소스 소프트웨어가 알려진 생태계와 문화 및 행동 환경이 있으며 Firefox와 같은 도구를 브라우저로 사용할 수 있으며 괜찮은 수준이라고 생각합니다. 그것이 안정되고 안전하게 될 때까지 일생. 그러나 그들이 사용하는 매우 큰 플랫폼 중 일부는 엔터프라이즈 급 독점 플랫폼입니다. 따라서 제가 오픈 소스 플랫폼으로 생각하는 것을 문화적 또는 정서적으로 쉽게 이해하는 것은 아닙니다. 나는 기본 개념으로 빅 데이터 및 분석을 사용하기 위해 로컬 프로젝트 인 작은 프로그램을 채택하는 것만으로 이것을 보았습니다. 나는 주요 도전 과제 중 하나라고 생각합니다. 지금 당신은 조직 전체에서 그것들을 보았을 것입니다. 결과를 얻으려는 욕구이지만 동시에 구식 캔에 한쪽 발을 붙어서 Oracle, IBM 및 Microsoft의“큰 브랜드를 삽입하십시오”. 이 새롭고 알려진 브랜드는 하둡 플랫폼과 함께 제공됩니다. 스트림과 같은 최첨단 기술을 갖춘 더 흥미로운 브랜드가 등장합니다.

그런 종류의 대화는 무엇입니까? 오늘 아침에 많은 참석을하고 있으며 모든 사람들이 생각하는 한 가지는“기판에서 관리 수준까지 모든 어려운 계층을 어떻게 잘라 내야합니까? "고객과의 대화는 어떻게 진행되며 StreamAnalytix와 같은 것을 채택 할 것을 염려하는 그러한 유형의 두려움을 완화 할 수있는 지점으로 어떻게 넘어가 는가?

Anand Venugopal : 고객이 선호하는 옵션으로 자연스럽게 오픈 소스로 전환하고 있기 때문에 실제로 가치 제안을 판매하는 것이 상당히 쉽다는 것을 알게되었습니다. 그들은 쉽게 포기하고“좋아요, 이제 오픈 소스로 갈 것입니다.”라고 말하는 것이 아닙니다. 실제로 주요 제품에 대한 매우 헌신적 인 평가를 거칩니다. 실제로 IBM이나 일반 제품이라고 가정 해 봅시다. 이러한 벤더 관계. 그들은 그 제품에 대해 우리 나 오픈 소스 엔진을 취급하지 않을 것입니다. 6 주에서 8 주에서 12 주 정도의 평가를 거칩니다. 그들은 여기에 내가 원하는 성능과 안정성이 어느 정도 있음을 확신하고“와우, 실제로 무엇을 할 수 있는지 알 수 있습니다.”라고 생각합니다.

예를 들어 오늘날 우리는 많은 스택 위에서 프로덕션 환경에서 스트림 분석을 실행하는 주요 계층 1 통신 회사를 보유하고 있으며, 매우 유명한 다른 벤더에 대해 평가하고 있으며 모두를 입증 한 후에 만 ​​확신하고 있습니다. 성능, 안정성 및 모든 것들. 그들은 당연한 것으로 받아들이지 않습니다. 그들은 오픈 소스가 그들의 평가를 통해 유능하다는 것을 알았으며 최악의 경우“아마도 할 수없는 두 가지 유스 케이스가있을 수 있지만 오늘날 대부분의 비즈니스 가속화 유스 케이스는 오픈 소스로 명백히 가능합니다 그리고 우리는 그것을 사용할 수있게합니다. 이것이 바로 가장 큰 지점입니다. 그들은 오픈 소스를 원했습니다. 그들은 실제로 수년 동안 사용되어 온 공급 업체 잠금 상황에서 벗어나려고합니다. "여기서 오픈 소스를 훨씬 쉽고 편리하게 사용할 수 있도록하겠습니다."

Dez Blanchfield : 기업들이 발견 한 또 다른 도전은 전통적인 현직을 도입 할 때 종종 우리가 여기서 이야기하고있는 흥미로운 것들의 최첨단에 뒤 떨어진 세대라고 생각합니다. 음수 약간. 단지 안정적인 플랫폼, 구식 개발 및 UATN 통합주기, 테스트 및 문서화, 마케팅 및 영업을 고려한 사항을 발표 할 세대와 여정이 있다는 것이 현실입니다. 당신이하고있는 유형에서, 내가 생각하고 싶은 것은 지난 밤에 어떤 종류의 연구 작업을 수행하는 최신 릴리스를보고 있다는 것입니다. 선구적인 컨설팅 관점과 구현을 통해 역량을 갖추게되었지만 롤업 할 수있는 스택도 얻었습니다. 저는 이것이 현직 직원들이 한동안 어려움을 겪고있는 곳이라고 생각합니다. 우리는 내가 시장에서했던 것처럼 많은 것을 보았습니다. 그것들은 종종 내가 따라 잡기 노드라고 부르는 반면, 대화를 나눌 때 구현하고있는 시점에서 알려주는 것입니다.

채택한 국경 카테고리의 몇 가지 예를 몇 가지 알려 주시겠습니까? 예를 들어, 로켓 과학과 같은 위성 환경과 위성을 우주에 배치하고 화성에서 데이터를 수집하는 것과 같은 실제 환경이 있습니다. 지구상에서 그렇게하는 사람들은 소수에 불과합니다. 그러나 항공, 운송 및 물류, 제조 및 엔지니어링과 같은 건강과 같은 큰 업종이 있습니다. 지금까지 본 적이있는 더 크고 광범위한 산업 부문의 몇 가지 예는 무엇입니까? 입양?

Anand Venugopal : Telco가 큰 예입니다.

여기서 슬라이드를 빠르게 수정하려고합니다. 사례 연구 4의 슬라이드를 여기서 볼 수 있습니까?

이것은 큰 통신 회사가 셋톱 박스 데이터를 수집하고 여러 작업을 수행하는 경우입니다. 고객이 실제로 무엇을하고 있는지 실시간으로보고 있습니다. 셋톱 박스에서 실시간으로 오류가 발생하는 위치를 확인하고 있습니다. 그들은 고객이 콜센터에 알리려고 노력하고 있습니다.이 고객이 지금 전화를 걸면이 고객의 셋톱 박스의 코드 링크 정보, 유지 보수 티켓 정보는이 특정 고객의 셋톱 박스에 문제가 있는지 여부를 신속하게 상관시킵니다 고객이 단어를 말합니다. 모든 케이블 회사, 모든 주요 통신 회사에서이 작업을 수행하려고합니다. 셋톱 박스 데이터를 수집하고, 실시간 분석을 수행하고, 캠페인 분석을 수행하여 광고를 게재 할 수 있습니다. 큰 유스 케이스가 있습니다.

내가 말했듯이, 이 모기지 회사는 대규모 시스템이 데이터를 처리하는 일반적인 패턴입니다. 시스템 A를 통해 시스템 B로, 시스템 C로 흐르는 데이터는 모든 것이 일관성이 있어야하는 규제 대상 비즈니스입니다. 시스템이 서로 동기화되지 않는 경우가 있는데, 한 시스템은“총액이 천만 달러 인 백건을 처리하고 있습니다.”라고 말합니다. 시스템은“아니요, 다른 대출은 110 건을 처리하고 있습니다. 그들은 실제로 동일한 데이터를 처리하고 다른 해석을하기 때문에이를 신속하게 해결해야합니다.

신용 카드, 대출 처리, 비즈니스 프로세스 또는 모기지 비즈니스 프로세스 또는 기타 다른 프로세스에 관계없이 비즈니스 프로세스가 동기화되도록 실시간으로 상관 관계 및 조정을 수행하도록 지원하고 있습니다. 또 다른 흥미로운 유스 케이스입니다. 이상 감지를 위해 DNS 트래픽을보고있는 미국의 주요 정부 계약자가 있습니다. 그들이 구축 한 오프라인 교육 모델이 있으며 실시간 트래픽에서 해당 모델을 기반으로 점수를 매 깁니다. 흥미로운 사용 사례 중 일부입니다. 보안 대기 행렬을보고있는 주요 항공사가 있는데, 그들은“이것은 비행기 비행의 관문입니다. 현재 TSA 대기열은 약 45 분 대 2 시간입니다.” 그들은 여전히 ​​노력하고 있습니다. 흥미로운 IoT 사용 사례이지만 고객 경험을 향한 스트리밍 분석의 훌륭한 사례입니다.

Rebecca Jozwiak : 레베카입니다. 유스 케이스의 주제에 대해 이야기하고있는 청중은“이 사례 연구는 정보 시스템의 분석 측면에서 비롯된 것인지 아니면 더 많은 정보에서 비롯된 것입니까? 구체적인 질문이 있거나 염두에 두어야 할 사업?”

Anand Venugopal : 우리는 약 60 % 정도, 50 %에서 55 % 정도를 알고 있고, 매우 적극적이고 열정적 인 기술 이니셔티브를 알고 있고, 상당히 정통하고 특정 비즈니스 요구 사항을 이해하며, 아마도 한 명의 후원자가 있다고 생각합니다. 확인되었지만 이러한 기술 팀은 비즈니스 유스 케이스의 맹공격을 준비하고 일단 기능을 구축 한 후에는이를 수행 할 수 있다는 것을 알고 비즈니스에 적극적으로이를 판매합니다. 사례의 30 ~ 40 %에서 비즈니스에 스트리밍 분석 기능을 요구하는 특정 사용 사례가 이미있는 것으로 나타났습니다.

Rebecca Jozwiak : 말이됩니다. 나는 청중으로부터 약간 더 기술적 인 질문을 받았습니다. 그는 이러한 시스템이 Twitter 스트림이나 Facebook 게시물의 퇴적물과 같은 구조적 및 비 구조적 데이터 스트림을 모두 지원하는지 궁금해하고 있습니까, 아니면 초기에 필터링해야합니까?

Anand Venugopal : 우리가 이야기하고있는 제품과 기술은 구조화 된 데이터와 구조화되지 않은 데이터를 매우 임박하게 지원합니다. 구성 할 수 있습니다. 모든 데이터는 텍스트이든 XML이든 관계없이 어떤 종류의 구조를 가지고 있습니다. 타임 스탬프 피드가 있다는 점에서 일부 구조가 있습니다. 데이터 구조를 구문 분석하기 위해 구문 분석을 스트림에 주입 할 수 있도록 구문 분석해야하는 또 다른 블로 브가있을 수 있습니다. 그것이 구조화되면, 우리는 시스템에 "알겠습니다. 쉼표로 구분 된 값이 있고 첫 번째 값이 문자열이면, 두 번째는 날짜입니다."라고 말하면 파싱 인텔리전스를 업 스크린 레이어에 주입 할 수 있습니다. 정형 및 비정형 데이터를 쉽게 처리합니다.

Rebecca Jozwiak : 청중으로부터 다른 질문이 있습니다. 나는 우리가 시간의 정상을 약간 지나쳤다는 것을 안다. 이 참석자는 실시간 스트리밍 애플리케이션이 트랜잭션 시스템, 예를 들어 제기 된 사기 방지 시스템으로 다시 통합 할 필요성과 기회를 모두 개발하고있는 것으로 보입니다. 이 경우, 거래 시스템을 그에 맞게 조정해야합니까?

Anand Venugopal : 합병입니다. 트랜잭션 시스템의 병합입니다. 때로는 트랜잭션을 실시간으로 분석하는 애플리케이션의 소스가되고 애플리케이션 플로우가 있다고하는 많은 경우에 정적 데이터 조회 사이트를 보여 주려고합니다. 그리고 HBase 또는 RDBMS와 같은 정적 데이터베이스를 찾고 스트리밍 데이터와 정적 데이터를 보강하여 의사 결정 또는 분석 통찰력을 얻습니다.

OLAP과 OLTP의 컨버전스와 같은 또 하나의 큰 산업 트렌드가 있습니다. 따라서 Kudu와 같은 데이터베이스와 트랜잭션 및 분석 처리를 동시에 지원하는 인 메모리 데이터베이스가 있습니다. 스트림 처리 계층은 완전히 메모리에 있으며 이러한 트랜잭션 데이터베이스 중 일부를 보거나 인터페이스 할 것입니다.

Rebecca Jozwiak : 혼합 워크로드는 가장 최근의 장애물 중 하나였습니다. 데즈, 로빈, 질문 더 있나요?

Dez Blanchfield : 마지막 질문으로 넘어가도 괜찮 습니다. 지난 10 년 동안 내가 처리해온 조직이 스트림 분석의이 흥미로운 도전으로 이끈 첫 번째 도전은, 우리가이 모든 도전에 대해 대화를 시작할 때 테이블에 다시 놓는 경향이있는 것입니다. 우리는 기술을 얻습니까? 우리는 어떻게 기술을 재 훈련하고 그 능력을 내부적으로 어떻게 얻습니까? 임페 투스가 와서 여행을 통해 우리를 붙잡은 다음 위대한 첫 걸음으로 구현하면 그렇게하는 것이 합리적입니다.

그러나 중간 규모에서 대규모 조직의 경우 현재이를 위해 준비하고있는 기능, 내부적으로 해당 기능을 구축하고 주변의 기본 어휘에서 무엇을 얻을 수 있는지, 어떤 종류의 메시지로 처리 할 수 ​​있습니까? 이런 종류의 프레임 워크로의 전환을 둘러싼 조직과 CEO의 IT 부서에서 기존 기술 직원을 재편성하여 구축 및 구현 한 후에 스스로 실행할 수 있습니까? 간단히 말해서, 어떤 종류의 도전 과제를 해결하고 어떻게 해결하고 있는지, 고객을 찾고 있는지, 그들이 찾은 도전의 종류와 경험과 지식을 회복하여이를 준비하고 준비하는 방법 운영 적으로 돌아 다닐 수 있습니까?

Anand Venugopal : 스트리밍 분석 플랫폼을 구매하려고하는 소수의 사람들이 하둡을 이미 알고 있고 이미 하둡 맵리 듀스 기술을 습득했으며 하둡과 긴밀히 협력하고 있다는 점에서 이미 합리적으로 똑똑합니다. 유통 업체라면 친숙합니다. 예를 들어 모든 것이 Kafka를 받고 있습니다. 그들은 무언가를하고 있으며 Storm 또는 Spark 스트리밍은 오픈 소스 도메인에 있습니다. 확실히, 사람들은 그것에 익숙하거나 주변의 기술을 익히고 있습니다. 그러나 그것은 충분히 숙련되고 똑똑한 소수의 사람들로 시작합니다. 그들은 회의에 참석하고 있습니다. 그들은 배우고 있으며 벤더들에게 지능적인 질문을하고 어떤 경우에는 벤더들과 함께 배우기도합니다. 벤더가 첫 미팅에서 와서 발표 할 때 물건을 알지 못할 수도 있지만 함께 읽고 나서 연주를 시작합니다.

그 작은 그룹의 사람들은 핵이되어 성장을 시작하고 이제 모든 사람들이 첫 번째 비즈니스 유스 케이스가 운영되고 있음을 알게됩니다. 지난주 스파크 서밋 (Spark Summit)에서 캐피탈 원 (Capital One)과 같은 대기업이 본격적으로 진출했습니다. 그들은 스파크를 선택했다. 그들은 그것에 대해 말하고있었습니다. 그들은 많은 사람들에게 스파크에 기여하기 때문에 많은 사람들을 스파크에서 교육하고 있습니다. 많은 대기업에서도 마찬가지입니다. 아주 똑똑한 사람들 몇 명으로 시작하여 전체 교육의 물결이 시작되고 사람들은 일단 수석 부사장 또는 한 번 수석 이사가 정렬되고 그들이 이것에 베팅하기를 원하고 단어가 돌아오고 있음을 알고 있습니다. 그들은 모두이 기술을 익히기 시작합니다.

Dez Blanchfield : 챔피언을 만드는 환상적인 시간을 가질 수있을 것입니다.

아난드 Venugopal : 예. 우리는 초기 챔피언과 함께 일하면서 많은 교육을 수행하고 많은 교육 과정을 진행하고 있으며 많은 대규모 고객을 위해 많은 사람들이 특히 많은 사용자를 주류 사용 단계로 끌어 들이기 위해 많은 훈련을 받았습니다. Hadoop MapReduce 사이트에서 우리는 고객 인 대기업 신용 카드 회사에서 적어도 5 ~ 8 개의 다른 교육 프로그램을 제공했습니다. 우리는 또한 사람들이 다운로드하고 익숙해 지도록 교육 할 수있는 샌드 박스를 포함한 모든 제품의 무료 커뮤니티 에디션도 보유하고 있습니다.

Dez Blanchfield : 오늘 아침 내가 당신을 위해 전부입니다. 대단히 감사합니다. 오늘 우리에게 제공되는 모델 유형과 사용 사례를 보는 것이 매우 흥미 롭습니다. 감사합니다.

아난드 Venugopal : 좋아. 대단히 감사합니다.

Rebecca Jozwiak : 이 Hot Technologies 웹 캐스트에 참여해 주셔서 감사합니다. Dez Blanchfield 박사, Robin Bloor 박사와 Anand Venugopal의 Impetus Technologies 사로부터 소식을 듣는 것은 매우 흥미 롭습니다. 발표자 감사합니다. 스피커와 청중에게 감사합니다. 다음 달에 또 다른 핫 테크놀로지가 있습니다. Insideanalysis.com에 보관 된 컨텐츠를 언제든지 찾을 수 있습니다. 또한 많은 콘텐츠를 SlideShare에, YouTube에도 흥미로운 내용을 넣었습니다.

그게 다야 다시 한번 감사하고 좋은 하루 되세요. 안녕.

Firehose 활용 : 스트리밍 분석에서 비즈니스 가치 얻기 : 웹 세미나 기록