오디오 모든 곳에서 분석 기능 구현 : 시민 데이터 과학자 지원

모든 곳에서 분석 기능 구현 : 시민 데이터 과학자 지원

Anonim

작성자 : Techopedia Staff, 2016 년 8 월 25 일

테이크 아웃 : 호스트 Rebecca Jozwiak는 Dr. Robin Bloor, Dez Blanchfield 및 David Sweenor와 함께 임베디드 분석 및 시민 데이터 과학자의 현상에 대해 논의합니다.

비디오를 보려면이 이벤트에 등록해야합니다. 비디오를 보려면 등록하십시오.

Rebecca Jozwiak : 신사 숙녀 여러분, Hot Technologies에 오신 것을 환영합니다. “모든 곳을 포용 : 시민 데이터 과학자 활성화”가 오늘 우리의 주제입니다. 나는 평소 호스트를 채우고 있는데, 이것은 Eric Kavanagh를 채우는 Rebecca Jozwiak입니다. 예, 올해는 덥습니다. 특히“통계 학자”또는“분석 전문가”와 같은 지루한 이름을 불렀지 만, “데이터 과학자”라는 용어는 많은 주목을 받고 있습니다. 많은 관심을 끌었습니다. 그들은 직장에 있고 조직에 유익한 것이 매우 바람직하며 모두가 하나를 원합니다. 그러나 그들은 1) 비싸고 2) 찾기가 어렵다. 아시다시피, 데이터 과학자 기술 부족에 대한 뉴스는 끝났습니다. 그러나 여전히 그들은 조직에 엄청난 가치를 제공하고 사람들은 소량을 떨어 뜨리지 않고 그 가치를 얻는 방법을 알아 내려고 소중합니다. 말하다.

그러나 희소식은 그 부족분을 보상하는 도구와 소프트웨어가 나오는 것입니다. 우리는 자동화, 기계 학습, 임베디드 분석을 가지고 있는데, 이것이 오늘날 우리가 배우게 될 것입니다. 그리고이 새로운 용어 인 "시민 데이터 과학자"가 생겨 났고 그 의미는 무엇입니까? 아니요, 숙련 된 데이터 과학자가 아닙니다. 비즈니스 사용자, BI 전문가, IT 전문가, 배경 지식은 있지만 전문 지식이 아닐 수도 있습니다. 그러나 이러한 도구와 소프트웨어는 심층 코딩을 모르더라도 더 많은 사람들이 스마트 솔루션에 액세스 할 수 있도록합니다. 그러나 모든 사람이 해당 분석적 사고에 조금 더 접근 할 수있게함으로써 전체적인 성능 향상에 도움이됩니다. 회사에 대한 좋은 통찰력을 얻을 수있는 호기심을 갖기 위해 반드시 교육을받을 필요는 없습니다.

오늘 우리와 함께 논의하기 어려운 데이터 과학자 인 Dez Blanchfield의 Bloor Group 최고 분석가 인 Robin Bloor가 오늘 우리와 함께 프레젠테이션을한다고 Dell Statistica의 David Sweenor가 발표했습니다. 그리고 그걸로 로빈 블로어에게 넘겨 줄 것입니다.

로빈 부어 : 좋아요, 소개해 주셔서 감사합니다. 나는 역사적 맥락에서 이것에 대해 생각했습니다. 우리가 실제로보고있는 것은 레오나르도 다빈치의 디자인 중 하나입니다. 나는 그것이 실제로 작동하는지 전혀 모른다. 나는 그것에 들어 가지 않을 것입니다. 그러나 da Vinci는 da Vinci에 대해 생각할 때마다 지금까지 존재 한 가장 호기심이 많고 분석적인 사람 중 한 사람으로 생각합니다. 그 글라이더가 새의 날개를 기반으로 설계되었다는 것을 알면 새의 비행을 연구하기 위해 어떤 식 으로든 새의 비행을 연구했습니다.

우리가 역사적 관점을 취한다면 (실제로 이것을 찾아 보았습니다) 분석은 아마도 가장 오래된 수학 응용 프로그램 일 것입니다. 적어도 바빌론 시대로 거슬러 올라가는 인구 조사가 있습니다. 우리는 기본적으로 그들과 같은 데이터를 가진 설형 문자 정제가 있기 때문에 이것에 대해 알고 있습니다. 이전에 되돌아 간 것이 있는지는 알려져 있지 않습니다. 그러나 분명한 것은 많은 사람들과 함께 문명을 가지고 있다는 것입니다. 실제로 계획이 필요하며 계획하고있는 것과 그 사람들의 요구 사항이 무엇인지 아는 것이 좋습니다.

초기 컴퓨터와 초기 컴퓨터 컴퓨터가 실제로 시작 되었기 때문에 컴퓨팅이 시작된 곳이기도합니다. 첫 번째는 Hollerith가 만든 인구 조사라고 생각합니다. IBM은 IBM이되었습니다. 이 모든 것이 발전했습니다. 아마도 1970 년대와 현재 사이에는 많은 다른 응용 프로그램과 분석이 있으며, 뒷좌석을 잡을 수있는 일종의 방해가있었습니다. 그렇습니다. 분석은 진행 중입니다. 특히 은행 및 보험 회사, 실제로 General Electric 및 통신 회사 등에서 발생했습니다. 그러나 비즈니스 전반에 걸쳐 일반적으로 사용되지 않았으며 이제는 전반적으로 전반적으로 사용되기 시작했습니다. 사업. 정말 게임이 바뀌 었습니다. 내가 관심을 가질 것이라고 생각한 첫 번째 것은 특히 데이터 피라미드입니다. 이것은 20 년 전 (최소 20 년 전)에 BI와 그 이전에 수행 된 초기 데이터 마이닝을 이해하려고 노력했던 것입니다. 여기서 정의한 것은 데이터의 아이디어이며, 예는 신호, 측정, 기록, 이벤트, 트랜잭션, 계산, 집계, 개별 정보 지점입니다. 그것들을 정보의 분자로 생각할 수도 있지만 그것들은 개별적인 포인트입니다. 상황에 따라 정보가됩니다. 링크 된 데이터, 구조화 된 데이터, 데이터베이스, 데이터 시각화, 플로터, 구성표 및 온톨로지 – 모두 다양한 정보를 모아서 데이터 포인트 이상의 것을 만들어 내기 때문에 정보로 간주됩니다. 실제로 모양, 수학적 모양을 가진 것입니다.

그 위에는 지식이 있습니다. 정보를 조사함으로써 다양한 패턴이 있다는 것을 알 수 있으며 규칙, 정책, 지침, 절차를 공식화하여 이러한 패턴을 활용할 수 있으며 지식의 형태를 취합니다. 그리고 거의 모든 컴퓨터 프로그램은 데이터에 대해 작업하고 규칙을 적용하기 때문에 일종의 지식입니다. 우리는이 3 개의 레이어를 가지고 있으며 레이어들 사이에서 진행되는 세분화가 계속되고 있습니다. 이 다이어그램의 왼쪽에는 새로운 데이터가 입력되는 것을 보여 주므로 많은 것들이 정적입니다. 데이터가 축적되고 정보가 축적되고 지식이 잠재적으로 증가하고 있습니다. 맨 위에, 우리는“이해”를 가지고 있으며, 철학적 인 주장이지만 이해는 인간에게만 존재한다는 것을 유지합니다. 내가 틀렸다면 우리는 어느 시점에 컴퓨터로 대체 될 것입니다. 그러나 토론을하기보다는 다음 슬라이드로 넘어가겠습니다.

제가이 흥미로운 것을 보았을 때, 이것은 최근의 일입니다. 흥미로운 것은 실제로 분석이 무엇인지 알아 내려고 시도하는 것이 었습니다. 그리고 결국 다양한 다이어그램을 그리고 이와 같은 다이어그램으로 마무리함으로써 실제로 분석 개발은 엄청난 양의 수학 공식을 사용한 소프트웨어 개발이라는 결론에 도달했습니다. 분석 탐색은 데이터에 대한 새로운 지식을 얻기 위해 실제로 여러 가지 다른 모델을 사용하여 조사한다는 점에서 소프트웨어 개발과 조금 다릅니다. 그러나 일단 생성하면 수동적 의사 결정 지원으로 생각되는 방식으로 구현됩니다. 이는 사용자에게 제공되는 정보입니다. OLAP와 같은 대화식 의사 결정 지원. 사용자에게 다양한 도구를 사용하여 스스로 조사하고 추론 할 수있는 구조화 된 데이터 세트가 제공됩니다. 많은 시각화는 이와 같습니다. 그리고 수집 한 분석 통찰력을 구현할 수있는 규칙 집합으로 바꿀 수 있다면 자동화가 필요합니다. 인간이 반드시 관여 할 필요는 없습니다. 그것이 내가 그 모든 것을 할 때 내가 본 방식입니다. 그리고 여러 가지 일들이 나에게 시작되었습니다. 일단 활동 영역이 일단 데이터 영역이 실제로 채굴되고, 철저하게 채굴되고, 가능한 모든 방향으로 철저히 탐색되면 결국 결정화 된 BI가됩니다. 발명 된 지식은 다양한 사용자에게 다양한 방법으로 정보를 제공하고 실제로 그들이하는 일을 실제로 수행 할 수있는 능력을 향상시키는 지식이되기 시작합니다.

내가 알았고 약 5 년 동안 예측 분석을 살펴 봤지만 예측 분석은 사람들에게 피드하기 위해 유용한 정보로 바뀌고 이미 지적한 바와 같이 BI가되고 있습니다. 자동화 된 BI 리포팅, BI 탐험, BI, 매우 다양한 그라데이션이 있으며 예측 분석은 실제로 세 방향으로 진행됩니다. 제가 지적한 분석 프로세스는 소프트웨어 개발과 다르지 않습니다. 단지 약간 다른 기술을 가진 다른 사람들이 수행 한 것입니다. 정말 훌륭한 데이터 과학자가 습득하는 데 몇 년이 걸리는 기술이 강조되어야한다고 생각합니다. 그것들은 쉽게 입수 할 수없고 많은 사람들이 그것을 할 수는 없지만, 그것이 무엇이 유효하고 무엇이 유효하지 않은지를 알기 위해 매우 복잡한 수준에서 수학을 이해하기 때문입니다. 분석 개발, 새로운 지식 발견, 분석 이식, 지식 운영에 관한 것입니다. 이것이 전체 분석에서 볼 수있는 배경입니다. 그것은 거대한 영역이고 그것에는 많은 차원이 있지만, 일반화는 모든 것에 적용된다고 생각합니다.

여러 조직이 있다고 언급했듯이 제약 회사는 DNA에 분석 기능을 가진 또 다른 조직이 있습니다. 그러나 실제로 DNA에는없는 많은 조직이 있으며, 이제는 능력이 있습니다. 이제는 소프트웨어와 하드웨어가 예전보다 훨씬 비싸고 이제는 악용 할 수 있습니다. 나는 여러 가지를 말할 것입니다. 첫 번째는 분석이 많은 경우에 R & D라는 것입니다. 조직의 특정 영역에 분석을 적용하는 것만으로도 여러 가지 관점에서 고객 주문을 다시 분석하여 다른 데이터와 결합하는 방식이 평범 해 보일 수 있습니다. 그러나 실제로 분석은 조직 전체를 검토하고 조직 및 전체 활동 체인 내에서 진행중인 특정 활동을 거의 분석 할 수있는 가능성을 만듭니다. 그러나 일단 당신이 그 영역으로 이동하면, 나는 그것이 연구와 개발이라는 것을 유지할 것입니다. 그리고 몇 가지 질문을 받았습니다. 즉, "회사는 분석에 얼마를 소비해야합니까?"라고 대답합니다. 이에 대한 답변을 제공하는 가장 좋은 방법은 분석을 R & D로 생각하는 것입니다 "비즈니스 효율성 영역에서 R & D에 얼마를 투자 할 것입니까?"

또한 분석 기능이없는 비즈니스에는 모르는 것이 많습니다. 우선, 그들은 그것을하는 방법을 모른다. 일반적으로 실제로 조직 내에서 한 가지 방법으로 또는 다른 방법으로 분석을 채택하는 경우 – 실제로는 거의 불가능한 일이기 때문에 대부분의 경우 불가능하거나 매우 어려울 수 있습니다. 기업은 실제로 데이터 과학자를 고용하여 데이터 과학자를 찾고 비용을 지불하며 실제로 원하는 일을하도록 신뢰합니다. 매우 어렵다. 대부분의 비즈니스는 실제로이 작업을 수행하기 위해 직원을 고용하거나 교육하는 방법을 모릅니다. 그 이유는 DNA에 아직 포함되지 않았기 때문에 자연 비즈니스 프로세스의 일부가 아닙니다. 다음 지점으로 이동합니다. 그들은 그것을 비즈니스 프로세스로 만드는 방법을 모른다. 그건 그렇고, 최선의 방법은 제약 회사와 보험 회사가 보는 것을 복사하고 건강 관리 센터의 일부 회사는 분석을 사용하고 복사하는 방식을 살펴 보는 것입니다. 비즈니스 프로세스이기 때문입니다. 경찰이나 경찰에 대한 방법을 모릅니다. 정말 많은 소프트웨어 회사들이 엄청나게 많은 분석을 자동화하는 제품을 만들었 기 때문입니다. 감사에 대한 요점은 분석 계산 결과가 무엇인지 이해하도록 신뢰할 수있는 컨설팅 또는 현장에 누군가가있는 경우 중요합니다. 이는 일종의 선택이지만 실제로 강력한 분석 도구를 분석을 제대로 이해하지 못하는 사람들의 손에는 정확하지 않은 결론으로 ​​넘어갈 수 있습니다. 내가 말했듯이 회사는 예산을 책정하는 방법을 모릅니다.

이것들은 분석의 풍미입니다. 나는 그것들을 통과 할 것입니다. 통계 분석 및 통계 모델링은 예측 분석과 크게 다르며, 대부분 곡선 맞춤입니다. 머신 러닝은 기본적으로 상태 스트림에서 다시 수행되는 경로 분석 및 시계열과 다릅니다. 그래프 분석은 다시 다르고 텍스트 분석과 의미 분석은 다시 다릅니다. 이것은 이것이 매우 다중 장르라는 것을 지적하고 있습니다. 분석을 시작하지 않고, 문제를 찾기 시작하고, 다양한 도구와 그에 적합한 다양한 분석을 찾습니다. 그리고 마지막으로 그물망. 하드웨어 및 소프트웨어의 발전으로 인해 제 생각에는 분석이 초기 단계입니다. 앞으로 훨씬 더 많은 것들이 있으며 앞으로 몇 년 안에 그것이 펼쳐질 것입니다. 이제 공을 데즈에게 넘길 수 있다고 생각합니다.

Dez Blanchfield : 응, 따라야 할 힘든 행동에 대해 이야기 해, Robin. 내가 좋아하는 각도 중 하나 인 인간의 각도에서이 주제를 간단히 방문하겠습니다. 우리의 일상 생활에는 많은 변화가 있습니다. 현재 나의 관점에서 볼 때 우리의 일상 생활에서 가장 큰 혼란 중 하나는 단지 일상적인 일입니다. 일을 시작하고 고용 한 일을하려고 노력하며, 일상적인 사람에서 수퍼 히어로로 갈 것이라는 기대가 커지고 조직에 퍼져 매우 빠르게 정보를 방출합니다. 지식과 정보의 흐름에 대처하기 위해 사람들에게 더 좋고 더 나은 도구를 제공해야하는 것은 중대한 도전이자 점점 더 많은 노력을 기울이고 있습니다. . 그러나 항상 우리가 어떻게 이처럼 높은 정신이나 플래시 몹을 얻었는지 분석 할 수 있습니다. 그것은 우리가 분석으로서 말하는 것에 대해 우리를 이끌지 만 실제로 우리가 말하는 것은 사람들이 정보를 이용할 수있게하는 것입니다. 그들과 상호 작용하고 자연스럽고 정상적인 느낌을주는 방식으로 행동합니다.

사실, 그것은 어린 아이, 작은 아기, 바닥에 앉아 있고 iPad로 놀고 거기에 앉아 있고 이미지가 삐걱 거리며 삐걱 거리며 움직여서 화면을 가지고 노는 것에 대한 YouTube 비디오를 상기시킵니다. 거기에 데이터. 그리고 부모는 아이 패드를 가져 와서 아이의 무릎에 인쇄 된 잡지 인 잡지를 넣습니다. 그리고이 아이는 아마 2 살이 넘지 않을 것입니다. 아이가 매거진의 화면으로 스 와이프하기 시작하고 꼬집어 짜고 잡지가 응답하지 않습니다. 아이가 손가락을 들어 올려서“흠, 손가락이 작동하지 않는 것 같아요.”라고 생각하고 팔에 몸을 찌르며“아, 손가락이 작동하고 있습니다. 잘 보이네요”라고 말하면서 손가락이 휘젓고 손가락이 휘젓고 반응합니다. 예. 그런 다음 매거진과 다시 상호 작용을 시도하고 낮게 튀어 나오거나 꽉 쥐거나 스크롤하지 않습니다. 그런 다음 그들은 잡지를 가져간 다음 iPad를 무릎에 다시 꽂으면 갑자기 작동합니다. 그래서 여기에 와서 엔터테인먼트를 위해 분석 도구 또는 라이브 스트리밍 도구를 사용하도록 훈련받은 아기가 있습니다. 잡지가 어떻게 작동하고 페이지를 넘기는지는 해결할 수 없습니다.

그리고 그것은 그 자체로 흥미로운 개념입니다. 그러나 조직 내에서 이동하는 지식, 데이터 흐름 방식 및 사람들의 행동 방식에 대해 생각할 때 사람들이 플래시 몹으로 배운 것, 즉 소셜 미디어가 만드는 행사에 대한 개념을 종종 생각합니다. 이 일과 날짜와 행동 에이 장소로 이동하는 아이디어 또는 비디오를보고 춤을 배우 거나이 색 모자를 쓰고 1시에 북쪽을 가리 킵니다. 그리고 여러분은 이것을 네트워크를 통해 밀어 내고, 항상 수백명의 사람들과 같은 수백명의 사람들이 같은 장소에서 동시에 같은 일을하게됩니다.“거룩한 소, 하지만 정말 인상적입니다!”그러나 실제로 그것은 정말 간단한 아이디어이며, 우리의 네트워크를 통해 퍼져 나가는 간단한 개념이며 시각적으로 놀라 울 정도로 청각 적으로 인상적인 결과를 얻습니다. 그리고 조직, 사람들의 행동 방식 및 정보 시스템 및 고객과의 관계에 대해 생각할 때 종종 그렇게 단순합니다. 아이디어 나 개념, 또는 우리가 전달하려는 문화적 또는 행동 적 특성입니다. 도구와 정보를 통해 힘을 실어주십시오.

그리고 20 년 이상 동안 제가 가지고 있었던이 만트라 (mantra)를 뒷받침합니다. 즉, 직원들이 업무를 수행하는 데 필요한 것을 찾을 수 없다면, 도구 나 정보이든, 그들은 항상 바퀴를 재발 명 할 것입니다. 그리고 이것은 오늘날 점점 더 많은 도전입니다. 우리는 많은 지식과 많은 정보와 것들이 매우 빠르게 움직여서 사람들이 바퀴를 재발 명하는 것을 막고 싶습니다. 작업 환경을 생각할 때 가장 좋아하는 사람 각도로 돌아와서 큐비클이 좋은 결과를 얻는 데 도움이되는 환경이 아니라는 사실에 놀랐습니다. 여기 그림이 많이 바뀌지 않았고 벽을 낮추고 열린 작업 공간이라고 불렀습니다. 그러나 주위에 노란 고리가있는 가운데에는 지식을 교환하는 두 사람이 있습니다. 그럼에도 불구하고 나머지 방을 살펴보면 그들은 모두 거기에 정중하게 자리를 잡고 화면에 정보를 넣습니다. 지식과 데이터를 실제로 교환하지 않는 경우가 많으며 그 이유는 다양합니다. 그러나 왼쪽 원의 중간에있는 노란색 원 안에 대화가있었습니다. 두 사람이 채팅을하고 지식을 교환하고 무언가를 찾으려고합니다.“이 보고서가 어디에 있는지, 내가 어디 있는지 알고 있습니까? 이 데이터를 찾을 수 있습니다.이 작업을 수행하기 위해 어떤 도구를 사용합니까?”그리고 아마도 아무 효과가 없어서 바닥을 돌아 다니며 칸막이 사무실 공간의 규칙을 어 기고 직접 수행했습니다.

그리고 우리는 사무실 주변에서 농담으로 재미있게 찌르는 비슷한 환경을 가지고 있었지만 실제로는 매우 강력하고 효과적입니다. 그리고 제가 가장 좋아하는 것 중 하나는 워터 쿨러 (water cooler)라고하는 모바일 또는 고정형 분석 플랫폼입니다. 여기서 사람들은 그곳으로 올라가서 주변을 돌아 다니며 지식을 교환하고 아이디어를 비교하고 워터 쿨러에 서서 아이디어를 교환하면서 분석을 수행합니다. 그것들은 당신이 생각할 때 매우 강력한 개념입니다. 시스템과 도구로 번역 할 수 있다면 놀라운 결과를 얻을 수 있습니다. 그리고 우리는 항상 사무실에서 가장 강력한 데이터 배포 허브 인 리셉션 데스크라고 불리는 가장 좋아하는 것을 얻었습니다. 그리고 무언가를 찾을 수 없다면 어디로 가나 요? 글쎄요, 당신은 사무실 앞에 걸어 가서“x, y, z가 어디 있는지 아십니까?”라고 말하고, 나는 그들이 새로운 곳에서 적어도 한 번도 그 일을하지 않았다는 것을 감히 말해 줄 사람입니다. 직장이나 특정 시점에서 무언가를 찾을 수 없을 때가 있습니다. 그리고 스스로에게 물어봐야합니다. 왜 그런가요? 인트라넷 또는 도구 또는 다른 곳에 있어야합니다. 찾기 쉬워야합니다.

따라서 데이터 및 분석과 직원이 업무를 수행하고 직원이 작업과 상호 작용하는 방식을 수행하도록 제공 한 도구에 관해서는 최근 분석 도구와 빅 데이터 플랫폼이 등장하기 전에 또는 "데이터 처리"는 구식 학교라고도합니다.보고 및 지식 공유는 역동적이거나 협업 적이거나 개방적이지 않으며 사람들이 업무를 수행 할 것으로 예상되는 시스템 유형에 대해 생각할 때 클래식, 사람들은 지금 레거시라고 부릅니다. 그러나 현실은 지금까지 남아있는 레거시 일 뿐이며 여전히 여기에 있기 때문에 실제로 레거시가 아닙니다. 그러나 기존 HR 시스템 및 ERP 시스템 – 인적 자원 관리, 엔터프라이즈 자원 계획, 엔터프라이즈 데이터 관리 및 회사를 운영하기 위해 정보를 관리하는 데 사용하는 시스템. 그것은 항상 사일로입니다. 최고급부터 부서 인트라넷과 같은 간단한 플랫폼으로 사물이 어디에 있는지, 어떻게 정보를 얻을 수 있는지, 그리고 주변의 지식과 상호 작용하는 방법을 전달하려고합니다. 인트라넷에 팝업을 표시합니다. 시간을내어 노력하는 사람들만큼이나 좋습니다. 그렇지 않으면 머릿속에 남게됩니다. 또는 식품 체인의 하단, 회사 SAN 및 그 사이의 모든 데이터를 확보 할 수 있으므로 스토리지 영역 네트워크에는 파일과 데이터가 가득하지만 어디서 찾을 수 있는지 알고 있습니다.

종종 폐쇄 형 데이터 플랫폼 또는 폐쇄 형 시스템을 구축 했으므로 사람들은 스프레드 시트 및 PowerPoint 등으로 돌아와 정보를 전달했습니다. 그러나 최근 제 마음에는 흥미로운 일이 있었고, 실제로는 모바일 장치와 인터넷이 일이 실제로 더 나아질 수 있다는 생각으로 작동한다는 것이 었습니다. 그리고 주로 소비자 공간에서. 그리고 우리가 일상 생활에서 인터넷 뱅킹과 같은 것들을 갖기 시작한 것은 흥미로운 일입니다. 우리는 실제로 은행과 거래 할 필요가 없었습니다. 전화로 할 수있었습니다. 원래 그것은 어색했지만 인터넷이 돌아 왔고 우리는 웹 사이트를 가지고있었습니다. 알다시피, 최근에 은행에 실제로 몇 번이나 가봤습니까? 나는 실제로 할 수 없었고, 다른 날에 이것에 대해 대화를 나누었고, 실제로 은행에 마지막으로 갔을 때를 기억할 수 없었습니다. 충격을 받았습니다. 나는 이것을 기억할 수 있어야한다고 생각했지만 너무 길었습니다. 전에는 내가 거기 갔을 때 실제로 기억할 수 없습니다 이제 휴대 전화, 휴대 전화, 태블릿 및 노트북의 형태로 이러한 도구를 손에 들고 네트워크와 도구 및 시스템에 액세스 할 수 있으며 소비자 공간이 개선 될 수 있다는 사실을 알게되었습니다. 기업과 환경 내에서 더 치명적이고 빙하적인 변화를 겪고있는 소비자 공간의 급격한 변화에 따라, 우리는 항상 그러한 변화를 일상적인 노동 생활로 바꾸지는 않았습니다.

그리고 하드 카피로 스트림 데이터를 라이브로 전송할 수 없다는 사실에 재미를 파는 것을 좋아합니다. 이 이미지에는 어떤 분석가를보고 앉아있는 사람이 있습니다. 그리고 통계학 자나 보험 계리사로서 많은 돈을 지불 한 누군가가 만들어 낸 아름다운 그래프가 있습니다. 하드 카피 분석 및 파킹. 그러나 여기 나를위한 두려운 점이 있습니다. 예를 들어, 이 회의실에있는 사람들은 이것을 예로 들어서, 지금은 과거의 데이터와 상호 작용하고 있습니다. 그리고 그것은 그 물건이 생산되고 인쇄 된 때부터 오래되었으므로, 아마도 일주일 된 보고서 일 것입니다. 이제 그들은 나쁜 데이터가 아니라 오래된 데이터를 결정하고 있습니다. 그들은 오늘날 역사적인 것을 바탕으로 결정을 내리고 있습니다. 우리는 소비자 공간에서 매우 빠르게 작업했기 때문에 하드 카피를 태블릿 및 전화기와 같은 것으로 대체했으며, 이제는 엔터프라이즈 공간에서 실시간으로 통찰력이 실시간 가치라는 점에서 해결했습니다.

그리고 우리는 점점 더 나아지고 있습니다. 그리고 그것은 Robin이 일찍 제기 한 시점으로, 시민 데이터 과학자의 개념이자이 개념의 원동력이었습니다. 나에게있어 시민 데이터 과학자는 아이 패드와 같은 도구와 정보를 가진 일반 사람들 일 뿐이다. 그들은 수학을 할 필요가 없으며 알고리즘을 알 필요가 없으며 알고리즘과 규칙 데이터를 적용하는 방법을 알 필요가 없으며 인터페이스 사용법을 알아야합니다. 그리고 저의 소개와 아이 패드 대 잡지, 아이 패드와 함께 앉아있는 유아의 개념으로 돌아 가게됩니다. 유아는 게임이나 스트리밍 미디어 또는 비디오가 있더라도 iPad의 인터페이스를 사용하여 정보를 탐색하고 상호 작용하는 방법을 매우 빠르고 직관적으로 배울 수 있습니다. 그러나 잡지 바에서 동일한 응답이나 상호 작용을 얻지 못하고 페이지마다 깜박 거리는 것은 특히 iPad로 자란 유아 인 경우 그리 매력적이지 않습니다. 항상 인간은 도구와 도구를 제공하는 방법과 모바일 장치, 특히 화면이 충분한 태블릿 및 스마트 폰과 같은 인터페이스를 제공하는 경우, 특히 상호 작용할 수있는 도구를 만드는 방법을 매우 빠르게보고 배울 수 있습니다. 손가락 동작만으로 갑자기 시민 데이터 과학자라는 개념을 얻게됩니다.

올바른 도구를 사용하여 데이터 과학을 적용 할 수 있지만 실제로 방법을 알 필요가없는 사람. 그리고 제 생각에이 말은 소비자의 영향에 의해 주도되어 수요와 기업으로 변화했습니다. 정말 빠른 몇 가지 예입니다. 우리 중 많은 사람들이 작은 광고를 넣거나 추적 및 이동을 보는 등 블로그 및 웹 사이트에서 작업을 시작하고 Google 웹 로그 분석과 같은 도구를 사용했으며 블로그와 작은 웹 사이트에서 깨어났습니다., 우리는 거기에 약간의 코드를 넣을 수 있었고 구글은 누가 언제, 어디서, 어떻게 웹 사이트를 방문하는지에 대한 실시간 통찰력을 줄 것입니다. 실시간으로 사람들이 웹 사이트를 방문하고 페이지를 방문한 다음 사라지는 것을 실제로 볼 수있었습니다. 그리고 그것은 놀랍습니다. 저는 여전히 사람들에게 실시간 분석을 설명하려고 할 때 구글 애널리틱스가 연결된 웹 사이트를 보여주기 위해 그것을 어리석게 생각합니다. 실제로 웹 사이트를 방문하는 사람들과 실제로 상호 작용하는 것을보고“ 실시간으로 비즈니스에 대한 통찰력을 얻었습니다. "

소매점의 예를 들어, 의약품을 생각해 보면 미국의 약국이라고합니다. 약국에서 두통 정제부터 썬 크림과 모자에 이르기까지 모든 것을 구입할 수 있습니다. 실시간 정보없이 조직을 운영하는 것은 이제 우리가 아는 것을 알고있는 무서운 개념입니다. 예를 들어 풋 트래픽을 측정 할 수 있습니다. 행복하기 때문에 화면의 한쪽에 웃는 얼굴을 가진 상점 주변에 장치를 배치 할 수 있으며 맨 오른쪽에는 불행한 빨간색이 있고 가운데에는 다른 색조가 있습니다. 그리고 요즘에는“행복한 또는 아닙니다”라는 플랫폼이 있습니다. 이곳에서 상점에 들어 서면 실제 고객의 의견에 따라 행복한 얼굴이나 슬픈 얼굴을 볼 수 있습니다. 그리고 그것은 실시간으로 대화식이 될 수 있습니다. 실시간 수요 중심 가격을 얻을 수 있습니다. 거기에 많은 사람들이 있다면 가격을 조금 올릴 수 있으며 재고 가용성을 확인하고 사람들에게 알릴 수 있습니다. 예를 들어 항공사는 사람들이 웹 사이트에서 몇 개의 좌석을 사용할 수 있는지 알려줍니다. '비행기 예약 중, 당신은 무작위로 전화를 걸지 않고 당신이 비행기를 타기를 원합니다. 실시간 HR 데이터를 통해 사람들이 언제 시계를 켜고 시계를 끄는 지 알 수 있습니다. 조달, 조달 중이고 실시간 데이터를 보유한 경우 1 시간 동안 기다린 다음 미국 달러 가격에 대해 헤지 (hedge)를 수행하여 다음 재고를 구매하고 물건을 싣을 수 있습니다.

사람들에게 Google 웹 로그 분석을 보여주고 이런 일화, 유레카 순간, 이“아하!”순간을 전달하면이 전구는 다음과 같이 떠납니다.“음, 내가 할 수있는 곳이 많이 있습니다. . 도구 만 가지고 있다면 그 지식에 접근 할 수 있다면.”그리고 우리는 지금 이것을 소셜 미디어에서보고 있습니다. 아침 식사 사진 만 보여주는 것 외에 정통한 소셜 미디어 사용자는 누구나 좋아하는 정보와 트래픽을 얼마나 많이 받고 있는지, 친구가 몇 명인지를보고 싶어합니다. 예를 들어 Twitter는 분석 도구입니다. Twitter.com으로 이동하여 도구를 사용할 수 있지만 Google Twitter Analytics dot com을 입력하거나 오른쪽 상단 버튼을 클릭하고 메뉴를 풀다운하면 몇 가지를 알려주는 예쁘고 생생한 그래프가 나타납니다. 당신이하고있는 트윗과 그들과의 상호 작용 횟수. 개인 소셜 미디어에서 실시간 분석이 가능합니다. Google 애널리틱스, Facebook, LinkedIn 및 Twitter를 좋아한다면 eBay 통계가 업무 환경에 있다고 생각하십시오.

이제 우리는 손끝에서 라이브 웹과 모바일을 얻었고, 그것은 파워 컨셉이되었습니다. 따라서 결론에 도달하게되었으며 도구와 기술을 조기에 활용하는 조직은 경쟁 업체가 실제로 따라 잡을 수없는 경쟁 업체에 비해 상당한 이점을 얻습니다. 그리고 우리는 지금 시민 데이터 과학자의 갈등과 함께 그것을보고 있습니다. 우리가 기술과 인력을 가지고 사람들을 데려 갈 수 있고 올바른 도구를 제공 할 수 있다면, 특히 실시간 데이터를보고 데이터를 발견하고 큐비클 주위를 걷지 않고도 데이터의 위치를 ​​알 수있는 기능을 제공 할 수 있습니다 사람들과 비교 분석을하기 위해 워터 쿨러에 서서 색인이있는 곳으로 가서 리셉션에 문의해야합니다. 그들이 손끝에서 그렇게 할 수 있고 그들과 회의에 가져 가서 하드 카피가 아닌 실시간으로 스크린을 통해 튀어 나오는 중역 실에 앉아있을 수 있다면, 갑자기 우리는 실제로 필요하지 않은 직원들에게 힘을 실어주었습니다. 실제로 데이터 과학을 사용하고 조직에 놀라운 결과를 가져옵니다. 그리고 우리가 실제로 소비자가 기업으로 향하는 곳에서이 전환점을 넘어 섰다고 생각합니다. 도전은 우리가 어떻게 해당 기업을 제공 하는가이며, 이것이 오늘 토론에서 추측 한 주제입니다. 그걸로, 나는 내 조각을 마무리하고 우리가 어떻게 그것을 해결할 수 있는지 들려 줄 것입니다. 데이비드.

David Sweenor : 알겠습니다. 정말 감사합니다. Robin에게 감사합니다. 로빈, 당신의 원래 평가에 동의합니다 분석 프로세스는 소프트웨어 개발과 다르지 않습니다. 조직 내부의 과제는 실제로 정의가 잘되지 않았거나 탐색 구성 요소가 있고 창조적 구성 요소가있을 수 있습니다. 그리고 Dez, 당신도 알다시피, 나는 당신에게 동의합니다. 바퀴를 재발견하는 많은 것들이 있습니다. 그리고 당신은, 내가 오늘 들어가는 조직이 없다는 것을 알고 있습니다. 왜 사업이 이런 식으로 운영됩니까? 또한 질문하기 쉽고 조직 내에서 많은 경우 변경하기가 어렵습니다. 나는 비유, 사물의 소비를 좋아합니다. 그리고 더 이상 공항에 가서 좌석을 바꾸고 싶을 때 핸드폰에서 할 수 있습니다. 부스에서 상담원에게 다니지 않아도되고 좌석 배정을 변경하기 위해 15 분 동안 흑백 모니터에 상담원이 입력하는 것을 볼 수 있습니다. 난 그냥 내 휴대 전화에서 그것을 선호하고, 그래서 흥미로운 개발입니다.

오늘, 우리는 집단 지능에 대해 조금 이야기 할 것입니다. 모르는 사람들을 위해 Statistica는 30 년 이상 사용되어 온 최첨단 분석 플랫폼입니다. 분석가 업계의 간행물을 보면 항상 가장 직관적이고 사용하기 쉬운 고급 분석 소프트웨어 패키지 중 하나입니다. 우리는 지난 몇 년 동안 집단 지능이라는 개념을 연구하면서 다음 단계로 나아가고 있습니다. 이 대화를 시작하고 싶었습니다. 조직에서 어떻게 작업을 수행합니까?

그리고 여기에 두 개의 이미지가 있습니다. 왼쪽의 이미지는 1960 년대의 이미지이며 1960 년대에 경력을 시작하지 않았지만 오른쪽 이미지는 제가 일하기 시작한 반도체 공장입니다. 저는 검은 건물, 왼쪽 위의 검은 지붕에서 일했습니다. 그러나 그들은 반도체 재료를 만들었습니다. Google 이미지의 최근 사진입니다. 그러나 왼쪽의 1960 년대 이미지로 돌아 가면 매우 흥미 롭습니다. 이 사람들은 일렬로 앉아 있고, 그들은 집적 회로와 반도체를 만들고 있습니다. 그러나 표준화가 있고, 일을하는 표준 방법이 있으며, 잘 정의 된 프로세스가있었습니다. 아마도이 사람들은 모두 개방 된 환경에 앉아 있기 때문에 공동 작업이 있었을 것입니다. 우리는 지식 인력 내에서 약간의 손실을 입었다 고 생각합니다.

왼쪽 상단에있는 건물에 앉았을 때 누군가와 공동 작업을하고 싶다면 열리지 않았습니다. 이 사무실이 있었을 수도 있고, 일부 팀이 멀리 떨어져 있었을 수도 있고, 이 캠퍼스를 건너야 할 수도 있습니다. 그것은 25 분 걸렸다. 그리고 나는 가장 오른쪽에있는 건물의 누군가와 이야기해야 할 것이다. 나는 우리가 길을 따라 뭔가를 잃은 것 같아요. 당신도 알다시피, 당신도 같은 생각을 가지고 있습니다. 왜 사람들은 – 얼마나 많은 사람들이 조직 내에서 바퀴를 재발 명합니까? 저는 1990 년대와 2000 년대에 CRM과 데이터웨어 하우징 그리고 어느 정도의 BI를 사용하여 조직 전체가 좋은 일을했다고 생각합니다. 어떤 이유로 분석이 약간 지연되었습니다. 데이터웨어 하우징, 표준화, 데이터, 이 모든 것 및 CRM에 대한 상당한 투자가 있었지만 분석은 어떤 이유로 지연되었습니다. 왜 그런지 궁금합니다. 창의력이있을 수도 있습니다. 프로세스가 명확하지 않을 수도 있고, 비즈니스에서 어떤 결정을 내리려고 어떤 결정이나 수단을 사용하고 있는지 모를 수도 있습니다. 오늘날 조직에 들어가면 많은 사람들이 스프레드 시트에서 매우 수동으로 일을합니다.

오늘 아침에 통계를 살펴본 결과 스프레드 시트의 90 %에 오류가 있으며 그 중 일부가 매우 중요하다고 생각합니다. JPMorgan Chase는 스프레드 시트 오류로 인해 수십억과 수십억 달러를 잃은 Whale의 것과 같습니다. 그래서 나는 내가 생각하는 전제를 가지고 있습니다. 일을 끝내는 더 좋은 방법이 있어야합니다. 우리가 언급 한 바와 같이, 우리는이 데이터 과학자들이 있습니다. 이 사람들은 비싸고 찾기가 어렵습니다. 그리고 때때로 그들은 약간 이상한 오리입니다. 하지만 데이터 과학자가 무엇인지 요약하면 데이터를 이해하는 사람 일 것입니다. 나는 수학을 이해하는 사람, 문제를 이해하는 사람이라고 생각합니다. 그리고 실제로 결과를 전달할 수있는 사람입니다. 그리고 만약 당신이 데이터 과학자라면, 당신의 급여는 지난 몇 년 동안 두 배가되었을 것이므로 요즘 매우 운이 좋습니다.

그러나 사실 많은 조직에는 데이터 과학자가 없지만 조직에는 똑똑한 사람들이 있습니다. 조직이 있고 똑똑한 사람이 많으며 스프레드 시트를 사용합니다. 통계와 수학은 주된 일이 아니라 데이터를 사용하여 비즈니스를 발전시킵니다. 실제로, 우리가 해결해야 할 과제는 데이터 과학 자나 통계학자를 두는 것이 운이 좋으면 어떻게해야하는지, 어떻게 받아 들일 수 있는지, 어떻게 사람들과의 협업을 개선 할 수 있는가하는 것입니다. 조직 내 다른 개인? 조직이 어떻게 구성되어 있는지 살펴보면 시작하겠습니다. 오른쪽에서 왼쪽으로갑니다. 그리고 나는 이것이 거꾸로 알고 있지만, 우리는이 비즈니스 사용자 라인을 가지고 있습니다.

이것은 대부분의 지식 근로자 인구이며, 이러한 사람들을 위해 업무용 응용 프로그램에 분석을 포함시켜야합니다. 아마도 콜센터 화면이나 그 밖의 것에서 분석 결과를보고 있으며 고객에게 다음으로 제공 할 최고의 제안을 말하고있을 것입니다. 웹 포털의 소비자 또는 공급 업체 일 수 있으며 즉시 신용을주는 것입니다. 그러나 아이디어는 분석을 소비한다는 것입니다. 우리가 중간으로 가면 이들은 지식 근로자입니다. 오늘날 스프레드 시트로 작업을 수행하는 사람들이 있지만 스프레드 시트는 오류가 발생하기 쉽고 어느 시점에서 가스가 부족합니다. 이 시민 데이터 과학자들은 우리가 부르는 것처럼 자동화 수준을 높이는 것입니다.

또한 분석 결과, 작업의 80 ~ 90 %가 데이터 준비 과정에 있으며 실제 수학은 아니지만 데이터 준비라고합니다. 우리는 당신이 그것을하든 그것을 자동화하려고 노력하고 있으며, 우리는 마법사와 템플릿과 재사용 가능한 것들을 가지고 있으며, 당신은 실제로 당신의 환경 내의 기본 인프라에 대한 지식이 필요하지 않습니다. 그리고 맨 왼쪽을 보면이 데이터 과학자들이 있습니다. 그리고 내가 언급했듯이, 그들은 공급이 부족합니다. 더 생산적으로 만들기 위해 우리가하려는 것은 시민 데이터 과학자들이 할 수있는 일을 만들어내는 것입니다. 레고 블록과 같이 생각하면이 데이터 과학자는 시민 데이터 과학자가 사용할 수있는 재사용 가능한 자산을 만들 수 있습니다. 한 번만 빌드하면 휠을 계속 재발 명할 필요가 없습니다.

또한이 직원들은 데이터베이스에서 작업을 수행 할 수 있는지, 회사에서 기존 기술 투자를 활용할 수 있는지 걱정할 수 있습니다. 아시다시피, 이 시대에는 전 세계에 걸쳐 데이터를 섞는 것이 이치에 맞지 않습니다. 앞서 언급했듯이 Statistica를 살펴보면 꽤 오랫동안 사용되어 온 플랫폼입니다. 그리고 그것은 매우 혁신적인 제품입니다. 데이터 블렌딩에 액세스 할 수없는 데이터 소스가 없습니다. 우리는 당신이 기대하는 모든 데이터 발견 및 시각화를 가지고 있습니다. 실시간으로 할 수 있습니다. 소프트웨어 툴 내에는 16, 000 가지가 넘는 분석 기능이 있다고 생각합니다. 그래서 그것은 내가 사용하거나 이해할 수있는 것보다 더 많은 수학이지만 필요하다면 거기에 있습니다.

비즈니스 규칙과 분석 워크 플로우를 결합하여 비즈니스 결정을 내릴 수 있습니다. 여기에는 알고리즘이 있고 여기에는 워크 플로가 있지만 항상 처리해야하는 비즈니스 규칙이 있습니다. 우리는 거버넌스에 매우 안전합니다. 우리는 FDA가 우리를 신뢰한다는 점에서 많은 제약 고객에게 사용됩니다. 푸딩에서 우리가 통제 할 수있는 통제력과 감사 능력이 있음을 증명하십시오. 마지막으로, 우리는 개방적이고 유연하며 확장 가능하므로 데이터 과학자의 생산성을 높이고 시민 데이터 과학자의 생산성을 높이고 자하는 플랫폼을 만들어야합니다. 이러한 분석 결과를 조직 내 작업자에게 배포합니다.

살펴보면 다음은 시각화의 예입니다. 그러나 분석 결과를 업무용 사용자에게 배포 할 수 있기 때문에 왼쪽의 첫 번째 예는 네트워크 분석 다이어그램입니다. 그리고 아마도 당신은 사기성 조사관 일 것입니다. 그리고 당신은 이러한 연결이 어떻게 만들어 졌는지 알지 못합니다. 그리고 이것들은 사람이 될 수 있고, 이것들은 엔티티가 될 수 있고, 계약이 될 수 있습니다. 그러나 당신은 이것을 사용하여 마우스로 조작하고, 실제로 이해하기 위해 상호 작용할 수 있습니다. – 사기 조사자라면 조사 할 사람의 우선 순위 목록을 이해해야합니다. 왜냐하면 모든 사람과 대화 할 수 없기 때문입니다. 우선 순위를 정하십시오.

예측 유지 보수 대시 보드의 오른쪽 이미지를 보면 매우 흥미로운 문제입니다. 아마도 당신은 공항의 주인 일 것이고, 당신은이 바디 스캐너를 가지고있을 것입니다. 이 바디 스캐너는 공항에 가면 약 9 개월의 유효 기간이있는 구성 요소가 있습니다. 그리고 이것들은 정말, 정말 비쌉니다. 공항에 여러 개의 진입 점, 여러 대의 스캐너가 있고 번호 하나가 각 게이트에서 적절하게 직원을 확보하고 있는지, 스캐너에있는 부품에 대해서도 주문하고 싶지 않습니다. 일찍, 나는 그것이 부서지기 전에 그것들을 갖고 싶습니다. 공항을 소유 한 경우 이러한 상황이 언제 부서지고 직원 수준이 예측되는지 예측할 수있는 기능이 있습니다.

오른쪽 아래를 보면 제조 환경에있는 경우 제조 흐름을 그래픽으로 표현한 것입니다. 그리고보기가 약간 어렵지만 이러한 다양한 프로세스 분야에는 빨간색과 초록색 신호등이 있습니다. 따라서 엔지니어라면 매우 정교한 수학이 진행되고 있지만 해당 프로세스 부문을 자세히 살펴보고 살펴볼 수 있습니다. 매개 변수 및 입력으로 인해 제어가 불가능할 수 있습니다. 시민 데이터 과학자를 살펴보면 시민 데이터 과학자가 쉽게 사용할 수 있도록하는 것이 목표입니다. 우리는 마법사와 템플릿을 가지고 있으며, 정말 흥미로운 것은 자동화 된 데이터 상태 확인 노드를 가지고 있다는 것입니다. 그리고 이것이 실제로하는 일에는 스마트가 내장되어 있습니다.

데이터 준비에 대해 언급했습니다. 데이터 집계 및 준비에 상당한 시간이 걸립니다. 그러나 내 데이터가 있다고 가정 하고이 데이터 상태 검사 노드를 통해 실행할 수 있으며 불일치 및 Sparseness 및 이상 치를 확인합니다.이 모든 것들이 누락 된 값을 채우고 많은 수학을합니다. 이해할 수 없으므로 기본값을 그대로 사용하거나 좀 더 영리한 경우 변경할 수 있습니다. 그러나 요점은 우리는 그 과정을 자동화하고 싶다는 것입니다. 이 작업은 정리 된 데이터 세트에서 약 15 가지의 다른 검사와 결과를 수행합니다. 우리가하는 일은 사람들이 이러한 워크 플로를보다 쉽게 ​​만들 수 있도록하는 것입니다.

여기서 우리는 데이터 과학자와 시민 데이터 과학자 간의 협력에 대해 이야기하고 있습니다. 오른쪽의 이미지를 보면이 데이터 준비 워크 플로가 표시됩니다. 그리고 이것은 매우 정교하고 아마도 이것이 회사의 비밀 소스 일 것입니다. 모릅니다. 그러나 우리는 조직 내 누군가가 우리가 가진 하나 이상의 데이터 사일로에 액세스 할 수 있다는 것을 알고 있습니다. 우리는 1 위를 잡고 그들을 모으고 함께 스티치하고 2 위를 할 수있는 방법이 필요합니다. 우리가하고 싶은 특별한 처리가있을 수도 있습니다. 데이터 상태 점검을 넘어서는 것이기 때문입니다. 이것이 바로 회사의 비밀 소스입니다. 조직 내에서이 워크 플로를 만들 수 있으며 노드로 축소됩니다. 화살표가 아래쪽을 가리키고있는 것은 노드 일 뿐이며 조직 내에서 수백 가지를 가질 수 있습니다. 아이디어는 특정 공간에 대해 아는 사람들이 있으며 워크 플로를 만들 수 있으며 다른 사람이이를 재사용 할 수 있다는 것입니다. 우리는 바퀴의 재발 명을 최소화하려고 노력하고 있습니다.

또한 분석 모델링 워크 플로에서도 동일한 작업을 수행 할 수 있습니다. 이 경우 오른쪽의이 워크 플로에는 15 가지 알고리즘이있을 수 있으므로 작업에 가장 적합한 알고리즘을 선택하고 싶습니다. 그리고 시민 데이터 과학자로서 스파이더 웹 엉망에서 무슨 일이 일어나고 있는지 이해할 필요는 없지만, 그것은 단지 노드로 붕괴되고 아마도 그 노드는 단순히 "신용 위험 점수 계산"이라고 말합니다. 수술 부위 감염의 원인이 무엇입니까?” "무단 거래가 될 확률을 계산하십시오."시민 데이터 과학자로서, 다른 사람이 만든이 매우 정교한 수학을 사용할 수 있습니다. 아마도이 데이터 과학자 중 하나가 내 조직 내에 구축했을 수도 있습니다.

데이터 과학의 관점에서 저는 코드 작성을 좋아하는 데이터 과학자들과 이야기를 나누었으며 코드 작성을 싫어하는 데이터 과학자들과 이야기했습니다. 괜찮습니다. 시각적 인 그래픽 사용자 인터페이스가 있습니다. 우리는 데이터를 얻을 수 있고, 자동화 된 데이터 상태 점검을 할 수 있으며, 코드를 작성하고 싶을 수도 있습니다. 나는 파이썬을 좋아하고 R을 좋아하지만 아이디어는 데이터 과학자들이 부족하고 특정 언어의 코드를 좋아한다는 것입니다. 우리는 특히 어떤 언어로 코딩하고 싶은지 선호하지 않으므로 R을 원한다면 R을하십시오. 파이썬을하고 싶다면 파이썬을하십시오. 훌륭합니다. 분석을 Azure로 버스트하려면 분석을 클라우드로 버스트하십시오. 따라서 여기서 목표는 데이터 과학자가 최대한 생산성을 발휘할 수 있도록 유연성과 옵션을 제공하는 것입니다.

이제 데이터 과학자, 그들은 똑똑한 사람이지만, 아마도 모든 전문가가 아닐 수도 있고, 그들이 할 수있는 일에 약간의 차이가있을 수도 있습니다. 그리고 업계 내를 살펴보면 거기에 존재하는 다양한 분석 시장이 있습니다. 이것은 아마도 이미지 인식이 필요하고 그 기술이없는 것의 예입니다. 아마도 알고리즘으로 가서 이미지 인식 알고리즘을 얻습니다. 어쩌면 나는 Apervita에 가서 매우 특별한 의료 알고리즘을 얻습니다. Azure 기계 학습 라이브러리에서 무언가를 사용하고 싶을 수도 있습니다. 어쩌면 네이티브 Statistica 플랫폼에서 무언가를 사용하고 싶을 수도 있습니다.

여기서도 아이디어는 글로벌 분석 커뮤니티를 활용하려는 것입니다. 네 방면에서 모든 기술을 갖추지 못할 것이므로 소프트웨어를 어떻게 만들 수 있습니까? 이것이 우리가하는 일입니다. 데이터 과학자가 다양한 시장의 알고리즘을 사용할 수 있습니다. 우리는 오랫동안 R과 Python으로 그것을 해왔지만, 현재 존재하는 앱 시장으로 확장되고 있습니다. 그리고 여기 위에서 볼 수 있듯이 Spark에서 H2O를 사용하고 있기 때문에 분석 알고리즘이 많이 있습니다. 처음부터 새로 만드는 데 집중할 필요가 없으며 오픈 소스 커뮤니티에있는 것을 재사용하고 가능한 한 생산성을 높이기를 바랍니다.

다음 단계는 시민 데이터 과학자와 데이터 과학자를 보유한 후 이러한 모범 사례를 어떻게 홍보하고 배포하는 것입니까? 우리는 소프트웨어 내에 기술을 보유하고있어 어디에서나 분석을 배포 할 수 있습니다. 그리고 이것은 모델 관리 관점에 지나지 않지만 더 이상 네 개의 벽이나 툴사, 대만 또는 캘리포니아의 특정 시설이나 당신이 가진 것에 구속되지 않습니다. 이 플랫폼은 글로벌 플랫폼이며 여러 사이트에서 사용하는 많은 고객이 있습니다.

정말 중요한 것은 대만에서 무언가를하고 브라질에서 복제하고 싶다면 정말 좋습니다. 거기에 들어가서 재사용 가능한 템플릿을 잡고 원하는 워크 플로를 잡으십시오. 이것은 그 표준과 일을하는 일반적인 방법을 만들기 위해 노력하고 있습니다. 그래서 우리는 모든 곳에서 완전히 다른 일을하지 않습니다. 그리고 이것의 다른 핵심 요소는 실제로 데이터가있는 곳으로 수학을 가져 가고 싶다는 것입니다. 캘리포니아와 털사, 대만과 브라질간에 데이터를 섞을 필요는 없습니다. 우리는 수학을 데이터로 가져올 수있는 기술을 가지고 있으며, 그 주제에 대한 또 다른 Hot Technology 웹 캐스트를 가질 것입니다.

그러나 우리는 이것을이 아키텍처라고 부릅니다. 그리고 여기에는 약간의 네이티브 분산 분석 아키텍처가 있습니다. 그 뒤에 핵심 아이디어는 플랫폼 Statistica가 있으며 분석 워크 플로를 원자로 내보낼 수 있다는 것입니다. 그리고 모델이나 전체 워크 플로를 수행 할 수 있으므로 중요하지 않습니다. 그러나 이것을 만들고 대상 플랫폼에 적합한 언어로 내보낼 수 있습니다. 이것의 왼쪽에서 많은 사람들이이 작업을 수행하지만 소스 시스템에서 점수를 매 깁니다. 괜찮습니다. 점수를 매길 수 있고 데이터베이스에서 모델 구축을 할 수 있으므로 흥미 롭습니다.

그리고 오른쪽에 Boomi가 있습니다. 이것은 동반 기술이며, 우리는이 모든 것들과 함께 일합니다. 그러나 이러한 워크 플로우를 수행하여 전 세계 어디에서나 전송할 수 있습니다. IP 주소가있는 모든 것 그리고 퍼블릭 또는 프라이빗 클라우드에 Statistica를 설치할 필요가 없습니다. JVM을 실행할 수있는 모든 것은 이러한 분석 워크 플로우, 데이터 준비 워크 플로우 또는 이러한 대상 플랫폼에서 모델을 실행할 수 있습니다. 내 공용 또는 개인 클라우드에 있든, 내 트랙터, 내 차, 집, 전구, 사물 인터넷에 있든 관계없이 전 세계 어디에서나 해당 워크 플로를 전송할 수있는 기술이 있습니다.

재검토 해보자. 아시다시피, 우리는 업무용 사용자가 있으므로 이러한 사람들은 기술을 통해 자신이 편한 형식으로 출력을 소비 할 수 있습니다. 우리는 시민 데이터 과학자를 보유하고 있으며, 우리가하려는 것은 협업을 개선하고 팀의 일원으로 만드는 것입니다. 그래서 우리는 사람들이 바퀴 재발 명을 멈추기를 원합니다. 그리고 우리는 이러한 데이터 과학자들이 있습니다. 거기에는 기술 격차가있을 수 있지만, 원하는 언어로 코딩 할 수 있고, 분석 시장으로 가서 거기에서 알고리즘을 사용할 수 있습니다. 그리고 이것으로 어떻게 모든 것이 훌륭하다고 생각할 수 없습니까? 이것은 완벽합니다. 이것이 우리가하는 일입니다. 우리는 재사용 가능한 워크 플로우를 구축하고, 사람들에게 지침을 제공하고, 레고 블록을 제공하여이 거대한 성을 건설 할 수 있도록하고 있습니다. 요약하자면, 우리는 비즈니스 사용자, 시민 데이터 과학자, 프로그래머 데이터 과학자에게 권한을 부여하는 플랫폼을 보유하고 있습니다. 모든 종류의 IoT 에지 분석 사용 사례를 처리 할 수 ​​있으며 이러한 집단 지능 개념을 가능하게합니다. 그것으로, 우리는 아마도 질문을 위해 그것을 열 것이라고 생각합니다.

로빈 블로어 : 좋습니다. 솔직히 말해서 Dell Statistica에 의해 브리핑을 받았으며 솔직히 말해서 프레젠테이션에서 자랐다는 사실에 대해 정말 놀랐습니다. . 그리고 분석을 채택 할 때 나에게 버그 베어가 된 것은 도구를 얻는 것이 그렇지 않다는 것입니다. 거기에는 수많은 도구가 있고, 오픈 소스 도구 등이 있으며, 제가 부르는 것은 반 플랫폼입니다. 그러나 나는 당신의 차이점, 특히 워크 플로 중 일부에 깊은 인상을 받았다고 생각합니다.

그러나 차이점은 엔드 투 엔드를 제공하는 것 같습니다. 분석은 데이터 수집으로 시작하여 데이터의 결함에 따라 일련의 전체 단계를 거치는 복잡한 비즈니스 프로세스와 비슷합니다. 데이터. 그리고 결과는 어떤 식 으로든 나타나고 그 결과는 행동이어야합니다. 많은 훌륭한 작업이 수행 된 곳에서 방대한 양의 분석이 이루어졌지만 실제로는 아무런 조치도 취하지 않았습니다. 그리고 당신은 필요한 것을 많이 가지고있는 것 같습니다. 나는 그것이 얼마나 포괄적인지 알지 못하지만 예상보다 훨씬 포괄적입니다. 나는 그것에 매우 감명 받았습니다.

스프레드 시트에 댓글을 달고 싶습니다. 당신은 이미 무언가를 말했지만, 내가 언급하고 몇 년 동안 언급 한 것 중 하나이지만, 점점 더 분명해졌습니다. 섀도우 시스템이며 실제로 생각하는 수많은 스프레드 시트가 있다는 것입니다 이 스프레드 시트는 소개되었을 때 훌륭한 도구 였고 여러 가지 방법으로 그 이후로 훌륭했습니다. 그러나 일반화 된 도구이므로 목적에 맞지 않습니다. BI 컨텍스트에서는 확실히 좋지 않으며 분석 컨텍스트에서는 끔찍하다고 생각합니다. 그리고 Statistica가 플러시되거나 과도한 스프레드 시트 사용 또는 그에 대한 의견이있는 예를 들어 봅시다.

David Sweenor : 예, 유명한 스프레드 시트 실수를 찾아 볼 수 있다고 생각합니다. 구글이나 당신이 사용하는 모든 검색 엔진은 많은 결과로 돌아올 것입니다. 우리는 스프레드 시트를 대체 할 것이라고 생각하지 않습니다. 그것은 우리의 의도가 아니지만 내가가는 많은 조직입니다.이 스프레드 시트 마법사 또는 닌자 또는 전화 할 것이 있습니다. 그러나 매우 정교한 스프레드 시트가 있으며 생각해야합니다. 사람들이 로또에서 이기고 돌아 오지 않습니까? 우리가하려는 것은 스프레드 시트가 존재하여이를 수집 할 수 있다는 것을 알고 있지만, 우리가하려는 것은 다른 사람들과 이해하고 공유 할 수 있도록 워크 플로우를 시각적으로 표현하는 것입니다. . 스프레드 시트는 매우 어렵고 공유하기가 어렵습니다. 스프레드 시트를 나에게 전달하자마자 변경했으며 이제 동기화되지 않아 다른 답변을 얻습니다. 우리가하려고하는 것은 이것 주위에 가드 레일을 배치하고 조금 더 효율적으로 만드는 것입니다. 스프레드 시트는 여러 데이터 세트를 결합하는 데 정말 끔찍합니다. 그들은 아래로 떨어집니다. 그러나 우리는 그것들을 대체하지 않을 것이며, 섭취하고, 변화를 시작하는 사람들이 있습니다. 왜냐하면“위험 계산”이라는 노드가 있다면 스프레드 시트를 사용하는 사람이하려고하는 것이기 때문입니다. 그래서 그들은 사라졌습니다.

Robin Bloor : 예, 제 생각에는, 제가 생각하는 관점 중 하나에서 스프레드 시트가 정보를 작성하기에 훌륭하다고 말하고 싶습니다. 그들은 지식의 섬을 만들기에는 훌륭하지만 지식을 나누는 것은 정말 나쁩니다. 그들은 그 일을 할 수있는 메커니즘이 없으며 누군가에게 스프레드 시트를 전달하면 그들이하는 일을 정확하게 설명하는 기사처럼 읽을 수는 없습니다. 거기에 없습니다. 프리젠 테이션과 Statistica의 기능에 대해 가장 큰 인상을 준 것은 놀라 울 정도로 불가지론적인 것 같습니다. 그러나이 스레드는 워크 플로우를 통해 실행됩니다. 데이터 수집에서 특정 BI 응용 프로그램에 결과를 포함하거나 심지어 실행중인 응용 프로그램에 이르기까지 엔드 투 엔드 워크 플로를 볼 수 있다고 가정합니까?

David Sweenor : 물론 이죠 . 그리고 엔드-투-엔드 기능이 있으며 일부 조직은이 기능을 전적으로 사용하며 요즘에는 어떤 회사도 한 공급 업체로부터 모든 것을 구매한다는 환상은 없습니다. 우리는 혼합이 있습니다. 어떤 사람들은 모든 것에 Statistica를 사용하고 어떤 사람들은 모델링 워크 플로에이를 사용하고 어떤 사람들은 데이터 준비 워크 플로에 사용합니다. 일부 사람들은이를 사용하여 수백 개의 엔지니어링 보고서를 엔지니어에게 배포합니다. 그래서 우리는 그 사이에 모든 것을 가지고 있습니다. 그리고 그것은 실제로 엔드-투-엔드이며 R 또는 Python, Azure, Apervita에서 사용하려는 알고리즘이 있다면 무엇이든 사용한다는 점에서 불가지론 적 플랫폼입니다. 훌륭하고, 생산적이며, 아는 것을 사용하고, 편안한 것을 사용하고, 통제되고 감사 가능하며 모든 종류의 것들을 보장하는 메커니즘이 있습니다.

Robin Bloor : 특히 그 측면이 마음에 듭니다 . 내 말은, 당신이 말한 것 이상으로 말할 수있는 것 이상으로 말할 수 있는지 모르겠습니다. 내 말은, 나는 이것을 보았지만 포괄적 인 방법으로 그것을 보지 않았고 확실히 우리 라이브러리에는 엄청난 양의 파이썬 라이브러리가 있지만 그 그림에 추가 할 수있는 것이 있습니까? 저는 이것이 매우 흥미로운 일이라고 생각합니다. 신뢰할 수있는 구성 요소를 갖게 될 것이라는 생각입니다. 구성 요소를 만든 다양한 사람들과 다운로드 할 수있는 다양한 사람들을 알고 있었기 때문입니다. 당신은 이미 그것에 대해 말한 것을 풍부하게 할 수 있습니까?

David Sweenor : 예. 일부 앱 마켓 플레이스, 알고리즘 마켓 플레이스가 있다고 생각합니다. 예를 들어, 아이오와 대학교 (University of Iowa)의 존 크롬웰 (John. Cromwell) 박사는 예측할 수있는 모델을 개발했습니다.이 모델은 우리가 운영되는 동안 실시간으로 사용되며, 수술 부위 감염. 그리고 그 점수가 충분히 높으면 수술실에서 바로 개입 할 것입니다. 매우 흥미 롭습니다. 아마도 크지 않은 다른 병원이있을 것입니다. Apervita는 분석을위한 건강 앱 마켓 플레이스입니다. 이러한 많은 앱 마켓 플레이스에서 하나를 찾아서 하나를 찾아서 재사용 할 수 있으며, 거래는 귀하와 해당 소유자 사이의 거래이지만, 하나를 찾거나“여기에는 요즘 모든 사람들이 전문가이기 때문에 모든 것을 알 수 없기 때문에 글로벌 커뮤니티를 활용하고 있다고 생각합니다. 저는 R과 Python이 하나라고 생각하지만“이 기능을하고 싶습니다.이 앱 마켓 플레이스 중 하나에 사양을 놓고 누군가가 당신을 위해 그것을 개발하도록하겠습니다.”라는 아이디어는 그들이 돈을 벌 수 있다고 생각합니다. 그것은 오픈 소스 모델과는 매우 흥미롭고 다릅니다.

로빈 블로어 : 좋습니다. 어쨌든, 나는 공을 데즈에게 건네 줄 것이다. 다이빙을 원하십니까, 데즈?

Dez Blanchfield : 물론 스프레드 시트에 잠시 머무르고 싶습니다. 왜냐하면 우리가 여기서 이야기하고있는 많은 것들의 올바른 요점을 포착했다고 생각하기 때문입니다. 그리고 이전 스프레드 시트를 물리적 형태에서 전자 형태로 전환하는 것과 관련하여 Robin에게 의견을 남겼습니다. 우리는 스프레드 시트가 원래 행과 열이있는 종이 시트 일 때 수동으로 내용을 기록한 다음이를 통해 계산하고 계산할 수있는 흥미로운 일이있었습니다. 머리 위로 또는 다른 장치와 함께 사용하십시오. 그러나 우리는 여전히 필기 실수 나 난독증으로 실수를 겪을 기회가 있으며, 이제는 오타로 대체했습니다. 스프레드 시트를 사용하면 위험 프로필이 더 빠르고 커질 수 있지만 Statistica와 같은 도구가 위험 피라미드를 뒤집는 것으로 생각합니다.

나는 종종 사람의 막대기 모양의 한 사람의 화이트 보드에 한 사람으로 그림을 그리고 그 아래에있는 사람들의 모음을 그 아래에 그린다. 그중 10 개가 그 화이트 보드의 맨 아래에 있다고 상상해 봅시다. 피라미드의 포인트는 한 사람과 피라미드의 발은 사람들의 컬렉션입니다. 그리고 나는 이것을 사용하여 상단의 한 사람이 스프레드 시트를 작성하면 실수를하고 10 명과 그것을 공유하고, 이제 우리는 10 개의 오류 사본을 가지고 있다는 아이디어를 시각화합니다. 매크로에주의를 기울이고 Visual Basic으로 이동할 때는 매우주의해야합니다. 스프레드 시트와 같은 전자 도구를 만들 때 매우 강력하지만 좋은 방법과 나쁜 방법으로 강력하기 때문입니다.

나는 Statistica와 같은 도구가 위험 프로파일을 뒤집을 수있는 능력을 가져다 준다고 생각합니다. 즉, 개인이 사용할 수있는 많은 도구를 얻었을 때와 우리가 그 도구와 알고리즘을 구축하는 사람들로 구성된 팀이 있다면 피라미드가 뒤집힌 피라미드 지점이 실제 도구입니다. 데이터 과학자는 데이터에 대한 회귀 분석 전문가가 될 필요는 없습니다. 그들은 도구를 사용할 수는 있지만 5 ~ 6 명의 통계 학자와 보험 계리사, 데이터 과학자 및 일부 수학자, 해당 도구, 해당 모듈, 알고리즘, 플러그인 등을 스프레드 시트 용어로 작업 할 수 있습니다. 사용할 수 있다고 발표 한 모든 스프레드 시트는 실제로 매크로를 테스트하고 Visual Basic을 테스트 한 후 알고리즘이 작동하는지 확인한 전문가가 작성했다고 상상해보십시오. 그래서 데이터를 가져 오면 데이터를 가져올 수는 있지만 실제로는 중단 할 수는 없습니다. 따라서 제어하는 ​​것이 좋습니다.

많은 분석 도구가 그렇게하고 있다고 생각합니다. 요점은 지금 당장 현장에서 볼 수 있다는 것입니다. 잠재적으로 오류와 실수 및 위험을 유발할 수있는 스프레드 시트에서 전환 도구를 사용하여 도구를 작성하는 지점으로의 전환을보고 있습니까? 데이터 검색이 실시간으로 정확하고 모듈 및 알고리즘을 구축하는 사람들이 해당 위험 프로파일을 제거하거나 줄이면서 현재 플랫폼을 개발하고 있습니까? 고객 서비스에서 실제 의미로 그것을보고 있습니까? 그렇지 않다고 생각합니까?

David Sweenor : 알다시피, 여기에는 몇 가지 방법이 있습니다. 그러나 우리가보고있는 것은 모든 조직에서 볼 수 있습니다. 저는 분석이 회사 투자 관점, 데이터웨어 하우징 및 CRM으로 수행 한 것의 종류에 비해 지연 될 수 있다고 생각했습니다. 그러나 우리가보고있는 것은 조직을 바꾸고 조직의 관성을 극복하기 위해서는 많은 시간이 필요합니다. 그러나 우리가보고있는 것은 사람들이 스프레드 시트를 가져 와서 워크 플로를 가져 오는 것입니다. 보안 및 거버넌스에 대해“글쎄, 아마도 스프레드 시트가있을 것입니다.”“글쎄, 이걸 잠글 수 있고 버전을 제어 할 수 있습니다.” 우리는 많은 조직을보고 있습니다. 그리고 그것이 바뀌면 워크 플로가 있고 결국 누가 그것을 바 꾸었습니까? 그들은 왜 그것을 바꿨습니까? 그들이 그것을 바꿀 때. 또한 워크 플로우에서 정의하려는 1, 2, 3 명이나 많은 당사자가이 새로운 스프레드 시트를 검증하고 검증하지 않는 한이 새 스프레드 시트를 프로덕션에 넣지 않도록 워크 플로우를 설정할 수도 있습니다. 사람들이 시작하기 시작하고 조직이 아기 발걸음을 내딛기 시작했지만 아직 갈 길이 멀다고 생각합니다.

Dez Blanchfield : 실제로 보안 통제와 거버넌스를 모두 구축하고 있다고한다면 워크로드는 자동으로 최고 리스크 책임자 (Chief Risk Officer)까지 모든 것을 자동으로 매핑 할 수 있습니다. 이러한 도구와 시스템에 액세스하는 방법과 해당 작업을 수행하는 사람을 제어 할 수 있으므로 매우 강력합니다. 나는 이것에 오는 다른 것들이 당신이 제공하는 도구 유형이 우리가 이야기하고있는 전통적인 스프레드 시트보다 인간의 행동에 빌려주는 것입니다. 사람들로 가득 찬 방이 있다면 동일한 대시 보드와 동일한 데이터에 액세스하여 실제로 다른 뷰를 얻을 수 있으며 결과적으로 동일한 정보에서 약간 다른 통찰력을 얻음으로써 요구 사항에 맞게 협업 할 수 있습니다. 그런 다음 동일한 PowerPoint를 사용하여 동일한 회의에 참석하고 동일한 스프레드 시트를 인쇄하여 모두 동일한 고정 데이터로 사용하는 것과는 대조적으로 비즈니스 및 의사 결정 프로세스와보다 인간적인 관점과 상호 작용을합니다.

현재 도구를 가지고있는 조직에서 행동과 문화의 변화를 겪고 있습니까? 방에있는 5 명의 사람이 말 그대로 같은 말로 스프레드 시트를보고 그것을 말로 작성하려고하는 것은 아닙니다. 하지만 이제는 실제로 시각화 및 분석을 통해 대시 보드 및 도구와 실시간으로 상호 작용하고 회의뿐만 아니라 조직 전체의 일반적인 공동 작업에서 대화와 상호 작용에 대해 완전히 다른 흐름을 얻고 있습니까? 그들은 실시간으로 할 수 있기 때문에 질문을하고 실제 답변을 얻을 수 있기 때문입니다. 현재보고있는 트렌드입니까, 아니면 아직 일어나지 않았습니까?

David Sweenor : 아니요, 저는 그 길을 확실히 시작했다고 생각합니다. 예를 들어 우리가 공장의 예를 들어 보면 매우 흥미로운 점이라고 생각합니다. 해당 공장 내에서 특정 프로세스 부문을 소유 한 사람이 특정 방식으로이 데이터를보고 상호 작용하기를 원할 수도 있습니다. 어쩌면 저, 모든 과정을 내려다 보았을 수도 있고, 아마도 맨 아래에있는 과정 일 수도 있습니다. 우리가보고있는 것은 첫째, 사람들이 조직 내에서 공통적 인 시각화 또는 표준 시각화를 사용하기 시작하지만 그들이 속한 역할에 맞춰져 있다고 생각합니다. 프로세스 엔지니어라면 아마 그것은 공급망 관점에서 보는 사람과는 매우 다른 견해이며, 그것이 맞춤화되어야하고 렌즈를 통해 작업을 완료해야하기 때문에 훌륭하다고 생각합니다.

Dez Blanchfield : 현명하고 정확한 의사 결정을 빠르게하기 위해 의사 결정 프로세스가 시간과 속도와 속도로 다운되는 것 습니까? 실시간 분석, 실시간 대시 보드가있는 경우, 손끝에 Statistica 도구가있는 경우 바닥을 가로 질러 뛰어 다닐 필요가 없습니다. 하드 카피. 협업하고 상호 작용하며 실제로 의사 결정을 내릴 수 있으며 즉시 결과를 얻을 수 있습니다. 일부 회사는 아직 파악하지 못했다고 생각하지만, 그렇게 할 때이 유레카 순간이 될 것입니다. 예, 우리는 여전히 칸막이에 머물면서 집에서 일할 수 있지만 상호 작용하고 협력 할 수 있으며 그러한 결정을 내릴 수 있습니다. 우리는 협력하면서 즉시 결과로 변합니다. 봐요, 지금까지 당신이 한 말을 듣는 것이 환상적이라고 생각합니다. 그리고 그것이 어디로 가는지 정말 기대하고 있습니다. Q & A에 많은 질문이 있다는 것을 알고 있으므로 레베카로 돌아가서 가능한 한 빨리 연락 할 수 있도록 몇 가지를 살펴 보겠습니다. 대단히 감사합니다.

Rebecca Jozwiak : 감사합니다 Dez, 그리고 Dave 씨, 우리는 청중으로부터 꽤 많은 질문을합니다. 통찰력에 대한 Dez와 Robin에게도 감사드립니다. 나는이 특정 참가자가 정각에 내려야한다는 것을 알고 있지만, 그녀는 일종의 질문을하고 있습니다. 정보 시스템 부서가 도구를 제공하는 데 익숙하지 않고 정교한 데이터 제어에 더 우선 순위를두고 있다는 것을 알고 있습니까? 지식 근로자? 내 말은, 그게 – 계속.

David Sweenor : 예, 조직에 따라 다릅니다. 은행, 보험 회사, 아마도 마케팅 조직과는 다른 우선 순위와 방법을 가지고 있다고 생각합니다. 나는 그것이 당신이보고있는 산업과 기능에 달려 있다고 말해야한다고 생각합니다. 산업마다 초점과 강조가 다릅니다.

Rebecca Jozwiak : 알겠습니다. 그리고 또 다른 참석자는 Statistica의 엔진이 무엇인지 알고 싶어했습니다. 그것은 C ++ 또는 당신의 물건입니까?

David Sweenor : 글쎄요, 30 년 전쯤 에 개발되었고 제 시간 전에 개발되었지만 Statistica 알고리즘 인 핵심 분석 알고리즘 라이브러리가 있다는 점에서 구체적으로 얻을 수 있을지 모르겠습니다. 그리고 당신은 우리가 R을 실행할 수 있고, 파이썬을 실행할 수 있고, Azure로 터질 수 있고, H2O에서 Spark를 실행할 수 있다는 것을 보았습니다. 그래서 나는 그 질문에 대답해야 할 것 같습니다. 여러 가지 엔진입니다. 그리고 어떤 알고리즘을 선택 하느냐에 따라 통계 알고리즘이라면 H2O와 Spark에서 하나를 선택하면 그 알고리즘을 사용하므로 다양한 알고리즘이 사용됩니다.

Rebecca Jozwiak : 좋아. 또 다른 참석자 종류는이 슬라이드를 구체적으로 가리키며 시민 데이터 과학자가 어떤 재사용 가능한 템플릿을 사용해야하는지 알고 싶어 하는가? 그리고 나는 그것에 대해 좀 더 광범위한 질문을 할 것 같습니다. 즉, 기간 업무 사용자 또는 비즈니스 분석가가 들어 와서 이러한 도구를 사용하려고 할 때 무엇을보고 있습니까?

David Sweenor : 대답을 드리겠습니다. Windows에 익숙한 사용자라면 Windows 기반 플랫폼 이므로이 스크린 샷의 상단을 잘라 냈지만 Windows 리본이 있습니다. 그러나 어떤 워크 플로를 사용해야하는지 어떻게 알 수 있습니까? Windows 탐색기처럼 보이므로 트리 구조가 있으며 조직에서 설정하려는 트리 구조를 구성하고 설정할 수 있습니다. 그러나 이러한 폴더가 있으면 재사용 가능한 템플릿을 해당 폴더에 넣을 수 있습니다. 그리고 회사가 채택 할 수있는 명명법이있을 것입니다. 여기에는 "위험 프로파일 계산", "이러한 소스에서 데이터 가져 오기"가 있으며 원하는 이름을 지정할 수 있습니다. 무료 폴더 일 뿐이므로 노트를 캔버스로 바로 드래그하면됩니다. 아주 쉽습니다.

Rebecca Jozwiak : 좋아. 다음 번에는 데모 일 수도 있습니다. 그런 다음 다른 참석자 유형이 나타납니다. 특히 스프레드 시트에서 부정확 한 부분까지 당신과 로빈과 데즈가 이야기 한 것이지만 쓰레기가 들어 오거나 쓰레기가 나오면 더 중요합니다. 분석에. 데이터를 잘못 사용하면 실제로 불행한 결정을 내릴 수 있습니다. 그리고 그는 더 안전한 알고리즘 개발에 대한 당신의 견해가 궁금합니다. 그는 분석의“과도한”사용이라는 단어를 사용한다고 생각합니다. 누군가 들어 와서 정말 흥분하고 고급 분석을 원하고 고급 알고리즘을 실행하려고하지만 확실하지 않을 수 있습니다. 그래서 당신은 그것을 막기 위해 무엇을해야합니까?

David Sweenor : 네, 최선을 다해 대답 할 것 같지만 모든 것이 사람, 프로세스 및 기술에 달려 있다고 생각합니다. 우리는 사람을 가능하게하고 조직 내에서 원하는 프로세스를 가능하게하는 기술을 보유하고 있습니다. 누군가에게 쿠폰을 보내는 예에서, 그다지 중요하지 않을 수도 있고, 디지털 인 경우 실제로 비용이 들지 않으며, 한 단계의 보안 제어가있을 수도 있고 걱정하지 않을 수도 있습니다. 수술 부위 감염을 예측한다면 좀 더 조심하고 싶을 것입니다. 또는 약물의 품질과 안전성 및 그와 같은 것들을 예측하고 있다면, 조금 더주의를 기울이고 싶을 것입니다. 당신이 옳고, 쓰레기를 버리거나 쓰레기를 버리는 것입니다. 따라서 우리가 시도하는 것은 조직이 채택하고 싶은 프로세스에 맞게 조정할 수있는 플랫폼을 제공하는 것입니다.

Rebecca Jozwiak : 좋아. 몇 가지 질문이 더 있지만, 한 시간이 지났다는 것을 알고 발표자에게 말하고 싶습니다. 그리고 Dell Statistica의 Dave Sweenor에게 감사드립니다. 물론, Robin Bloor 박사와 Dez Blanchfield 박사는 오늘 분석가가되어 주셔서 감사합니다. 다음 달에는 Dell Statistica를 통해 또 다른 웹 캐스트를 진행할 예정입니다. 나는 Dave가 그 주제에 대해 암시 한 것을 알고있다. 또 다른 흥미로운 주제 인 엣지에서의 분석에 관한 내용이 될 것이며, 웹 캐스트에서 매우 유용한 사용 사례에 대해 논의 할 것입니다. 오늘 본 것을 좋아한다면 다음 달에 다시 오십시오. 그리고 여러분과 함께, 나는 당신에게 작별 인사를합니다. 정말 고마워. 안녕.

모든 곳에서 분석 기능 구현 : 시민 데이터 과학자 지원