작성자 : Techopedia Staff, 2016 년 6 월 8 일
테이크 아웃 : 호스트 Eric Kavanaugh는 전문가 Dez Blanchfield, Robin Bloor 및 Bert Scalzo와 데이터베이스 기술 혁신에 대해 논의합니다.
현재 로그인하지 않았습니다. 비디오를 보려면 로그인 또는 가입하십시오.
에릭 카바나 흐 (Eric Kavanagh) : 신사 숙녀 여러분, 수요일은 동부 시간으로 수요일입니다. 나는 뉴 올리언스에 있습니다. 여름이 다가오고 있습니다. 이제 핫 테크놀로지의 시간입니다. 제 이름은 Eric Kavanagh입니다. 호스트입니다. Hot Technologies를 위해 여기서 공을 걷어차겠습니다. 오늘의 주제는“전진 모멘텀 : 관계를 넘어 전통적인 관계로 옮기기”입니다. 여러분, 오늘 전화 상으로 데이터베이스 전문가 3 명이 있습니다. 질문이 있으시면 어려운 질문을 보내십시오. 부끄러워하지 마십시오. 우리는 오늘 당신에게 줄 좋은 콘텐츠를 많이 가지고 있습니다. 나에 대한 당신의 진실에 대한 자리가 충분합니다. 물론 올해는 덥습니다. 우리는 Techopedia의 친구들과 파트너쉽을 맺고있는이 쇼에서 뜨거운 기술에 대해 이야기하고 있습니다. 그리고 우리는 오늘날 정보 관리의 기초로 나아가고 있습니다. 물론 데이터베이스입니다. 우리는 우리가 어떻게 왔는지, 오늘 무슨 일이 일어나고 있는지, 앞으로 일어날 일에 대해 이야기 할 것입니다. 매우 흥미로운 것들이 많이 진행되고 있습니다.
분명히 우리는 데이터베이스 공간에서 심각한 혁신을 이루었습니다. 한동안은 조용했습니다. 비즈니스의 일부 분석가와 이야기를 나누면 2005 년부터 2009 년 또는 '10 년과 같은 해에 아마도 혁신 측면에서 너무 많은 일이 일어나지 않은 것 같습니다. 그리고 갑자기 탈옥 등의 일이 일어 났고 이제는 흥미로운 일이 벌어지고 있습니다. 그것의 많은 것은 웹의 규모와 다른 흥미로운 일을하는 모든 멋진 웹 속성 때문입니다. 이것이 NoSQL 개념의 출발점입니다. 그리고 그것은 두 가지 다른 것을 의미합니다. 그것은 SQL을 지원하지 않는 것처럼 SQL을 의미하지 않으며 SQL뿐만 아니라 SQL을 의미하지 않습니다. 일부 사람들이 사용한“NewSQL”이라는 용어가 있습니다. 그러나 분명히 SQL (Structured Query Language)은 기본이며 쿼리의 기본입니다.
그리고이 모든 NoSQL 엔진이 무슨 일이 있었는지 흥미 롭습니다. 글쎄, 그들은 나왔고 그것에 대해 많은 흥분이 있었고 몇 년 후 우리 모두 무엇을 듣기 시작 했습니까? 아, 하둡에 대한 SQL. 글쎄, 이 모든 회사들은 SQL 인터페이스를 NoSQL 툴에 적용하기 시작했으며, 프로그래밍 분야에 종사하는 사람이라면 누구나 어려움과 어려움을 겪고 있으며 일부는 교차 와이어 등으로 이어질 것이라는 것을 알고 있습니다. 오늘 우리는 그 많은 것들에 대해 알아볼 것입니다.
우리는 3 명의 발표자가 있습니다 : 우리는 텍사스에있는 우리 자신의 Robin Bloor 인 시드니에서 Dez Blanchfield를 불러 왔으며, 또한 Bert Scalzo도 텍사스에 있습니다. 우선, Dez Blanchfield로부터 듣겠습니다. 여러분, 우리는 #HotTech의 해시 태그에서 트윗 할 것이므로 언제든지 의견을 보내거나 웹 캐스트 콘솔의 Q & A 구성 요소 또는 채팅 창을 통해 질문을 보내십시오. 그리고 Dez Blanchfield와 함께 가져 가십시오.
Dez Blanchfield : 감사합니다, Eric. 안녕하세요 그래서 지난 10 년간 일어난 일에 대한 30, 000 피트의 관점에서 장면을 설정하려고 노력할 것입니다. 데이터베이스 관리 시스템, 상업 또는 기술 관점의 영향 및 최근에 겪어 온 일부 트렌드를 통해 오늘날 우리가 주제와 관련한 대화로 이어질 수 있습니다.
여기의 표지 이미지는 모래 언덕이며, 그 위에 작은 모래 조각이 부는 바람이 있습니다. 그 결과, 모래 언덕은 한 공간에서 다른 공간으로 천천히 걸어갑니다. 그리고이 거대한 40, 50 피트 높이의 모래 산이 실제로 움직이는 놀라운 현상입니다. 그리고 그들은 매우 느리게 움직입니다. 그러나 그들은 확실히 움직입니다. 그리고 움직일 때, 그들은 풍경을 바꿉니다. 그리고 모래 언덕이 자연스러운 지역에서 시간을 보내면 볼만한 것이 있습니다. 언젠가 창 밖을 내다 볼 수 있고이 거대한 모래 산이 실제로 작은 작은 알갱이 자체로 움직였으며 바람이 천천히 한 곳에서 다른 곳으로 이동한다는 것을 깨달았습니다.
그리고 나는 여러면에서 그것이 꽤 오랫동안 데이터베이스 시스템의 세계라고 생각합니다. 아주 최근까지 아주 작은 모래 알갱이 형태의 작은 변화는 모래 언덕의 형태로 거대한 모래 산을 움직입니다. 지난 몇 년간 데이터베이스 플랫폼에 약간의 변화가 있었으며, 데이터베이스 시스템과 플랫폼 주변에서 중급의 메인 프레임을 통해 상당히 안정적이고 견고한 환경이었습니다. 그러나 최근 우리는 상업적 요구와 기술 동인에게 상당히 중요한 일이 발생했습니다. 그것들을 통해 우리를 안내 할 것입니다.
데이터베이스의 기본 개념은 수년 동안 알고 있었지만 프리 쇼 밴터에서 들었 듯이 오늘 나와 연락하는 두 명의 전문가가 평생을 보냈다는 견해가 있습니다. 이 공간과 그들은 80 년대 초에 시작되었을 때 거기에 있다는 자랑거리를 공유하는 데 상당히 옳았습니다. 그러나 우리는 지난 10 년 동안이 거대한 변화를 보았고, Dr. Robin Bloor에게 넘겨주기 전에 우리를 빠르게 안내 할 것입니다.
우리는 이것을“더 크고, 더 좋고, 더 빠르고, 더 싼”경험이라고 부릅니다. 내가 말했듯이 데이터베이스의 정의가 변경되었습니다. 데이터베이스 플랫폼이 성능을 다루어야하는 환경과 기술 및 상업적 요구 사항도 바뀌 었습니다. 우리는보다 복잡한 상업 또는 더 복잡한 기술 요구 사항을 처리하기위한 솔루션에 대한 이러한 수요 증가를 보았습니다. 제 생각에 실제로 의미하는 바를 정확히 살펴보면 90 년대가되었고 인터넷의 도입에 의해 데이터베이스 기술이 영향을 받았다는 것입니다. 규모. 우리는 터미널 앞에 앉아있는 사람들에 대해 이야기하는 것이 아니라 원래 물리적 프린터가 내장되어 있고 132 열의 텍스트가 종이에 나오는 텔레타이프 터미널과 비슷합니다. 그런 다음 초기 녹색 화면 터미널, 키보드로 펀칭합니다.
그러나 우리 세계는 터미널과 직렬 케이블 또는 네트워크 케이블이 오랫동안 컴퓨터와 통신하고 있음을 알고 있습니다. 인터넷과 인터넷의 폭발적인 성장으로 인해 더 이상 컴퓨터에 연결할 필요가 없었습니다. 데이터베이스 시스템에 가려면 웹 브라우저가 필요했습니다. 따라서 데이터베이스 기술은 세계를 색인화하는 데 사용 된 기본 검색 엔진 기술의 모든 규모를 처리하고 데이터베이스 형식 규모의 예에서 정보 색인을 저장하기 위해 극적으로 변화해야했습니다. 그리고 구글과 같은 사람들은 그것을 할 수있는 플랫폼을 제공했습니다. 그리고 모든 새로운 유형의 데이터베이스 스토리지와 쿼리 및 인덱싱이 생성되었습니다. 그리고 우리는 음악 사이트와 영화 사이트가 함께 왔습니다.
그리고 2000 년대에 우리는 닷컴 컴 붐을 보았고, 어떤 형태의 데이터베이스에 의해 구동되는 시스템을 사용하는 사람들이 훨씬 더 급격히 폭발했습니다. 이 단계에서 관계형 데이터베이스는 여전히 대부분의 부하를 처리하고 방금 더 큰 주석을 넣었으며 IBM 및 Sun 등의 사람들이 Unix 플랫폼을 실행하는 매우 중대형 시스템으로갔습니다. . 닷컴 컴 붐은 하드웨어, 성능 관점에서 일을 더 크고 빠르게 만들었고 데이터베이스 엔진에는 몇 가지 중요한 변화가 있었지만 더 좋은 점은 여전히 우리가 보았던 것과 같은 것이 었습니다. 장기.
그리고 우리는 웹 2.0 시대를 봤습니다. 그리고 갑자기 우리는 훨씬 더 간단한 데이터베이스 플랫폼을 필요로했고 수평 형태로 확장해야했기 때문에 엄청난 변화였습니다. 그리고 그것은 우리가 데이터베이스가 무엇인지에 대한 아이디어에 접근하는 방식에있어 중대한 변화였습니다. 우리는 여전히 내 견해를 따라 잡고 있습니다. 그리고 지금 우리는이 모든 문제를 다루고 있습니다. 저는 부정적인 의미가 아니라 긍정적 인 스핀으로 우리가 빅 데이터라고 부르는 것에 대한이 논쟁과 엄청난 폭발을 말합니다. 저는 폭발을 의미합니다. 데이터베이스에 대해 이야기 할 때 우리가 가지고있는 옵션의 수와 관계형 쿼리 기능의 형태에 대한 그래프에서이 터무니없는 변화가 있습니다.
그리고 흥미롭게도 저는 개인적으로 빅 데이터가 실제로 빙산의 일각에 불과하다고 생각합니다. 우리는 빅 데이터의 영향과 현재 이용 가능한 선택 유형에 대해 약간 흥분하는 경향이 있습니다. 우리는 NoSQL 엔진으로부터 모든 것을 얻었고, 그래프 엔진을 가지고 있으며, 데이터를 던지고 처리 할 수있는 모든 다른 유형의 플랫폼을 가지고 있습니다. 사실, 오늘 우리와 함께있는 Eric Kavanagh와의 첫 대화 중 하나는 Apache Drill이라는 주제에 관한 대화였습니다. 모델 내부의 데이터 : 하드 드라이브에 저장된 원시 CSE 파일부터 페타 바이트 규모의 HDFS 파일 시스템에 이르기까지 모든 데이터. 또한 모든 종류의 흥미 진진한 식물의 구조화 및 비 구조화 데이터에 대한 SQL 스타일 쿼리를 수행 할 수 있습니다.
우리는“스마트 빌딩 (smart building)”을 보게 될 것입니다. 우리는 보안 및 열 관리를위한 스마트 빌딩을 가지고 있다고 생각하고 싶습니다. 그러나 저는 당신이 누구인지에 대해 더 많이 알고있는 스마트 빌딩에 대해 이야기하고 있습니다. 그리고 당신이 걸을 때, 그리고 현명한 일을 지능적으로 수행하는 방법을 알고있는 똑똑한 도시 (도시 수준의 전체 생태계)를 통해 그 수준에서 모든 종류의 깔끔한 작업을 수행합니다. 그리고 그 이상으로, 우리는 전 세계의 어느 누구도 완전히 파악했다고 생각하지 않는이 놀라운 것을 얻었습니다. 그것이 사물 인터넷의 형태입니다. 지난 10 년 동안이 모든 변화가 있었으며, 대략 20 년이 지나면 우리가 데이터베이스를 고려하는 세계에 영향을 미쳤습니다.
이것을 가능하게 만든 몇 가지 중요한 것들이 있습니다. 하드 드라이브 비용이 급격히 줄어 들었고, 많은 방식으로 Hadoop 모델과 같은 일부 참조 아키텍처를 구동 할 수있게되었습니다. 많은 데이터를 가져 와서 많은 하드 드라이브에 분산 시켰습니다. 똑똑한 일을하세요. 그리고 실제로, 관계형 데이터베이스 또는 전통적인 DB 단위 모델에 대해 샤딩이 된 것입니다. 그리고 RAM은 매우 저렴 해져서 인 메모리와 같은 다른 레퍼런스 아키텍처로 플레이하고 매우 많은 양의 데이터를 파티셔닝하는 것과 같은 새로운 기회를 갖게되었습니다.
그리고 이것은 우리가 지금보고있는이 작은 그림을 보여주었습니다. 이것은 빅 데이터 환경에있는 경우 사용 가능한 플랫폼 유형을 보여주는 다이어그램입니다. 그리고 읽기가 매우 어렵고 그 이유는 너무 많은 정보가 있습니다. 모든 형태의 데이터베이스 시스템에 데이터를 넣고 쿼리하고 기존의 읽기 / 쓰기를 수행하는 방법에는 제조, 모델링 및 제조 옵션이 너무 많습니다. 그리고 그것들 모두가 모두 준수하는 것은 아니며 실제로 기본 스타일 표준을 준수하는 사람은 거의 없지만 여전히 데이터베이스라고 생각합니다. 그리고 90 년대와 인터넷 규모에서 웹 2.0으로, 그리고 빅 데이터를 통한 전체 성장으로의 의미에 대한 컨텍스트를 제공하기 위해 몇 초 안에 두 개의 화면을 보여 드리겠습니다. 이 빅 데이터 기술 랜드 스케이프 그래프에 많은 옵션이있어 흥미 롭다고 생각되면, 하나의 주요 카테고리를 살펴 보겠습니다.
마케팅 기술을 살펴 보겠습니다. 다음은 데이터베이스 관리 시스템 또는 mar-tech 공간 내의 데이터 관리를위한 옵션이므로 마케팅과 관련된 기술입니다. 이제 이것은 몇 년 전인 2011 년이었습니다. 5 년 전, 이것이 풍경의 모습입니다. 간단히 한 슬라이드로 돌아 가면 오늘날의 데이터 환경은 데이터베이스 기술에 적용되는 다양한 브랜드와 제품에서 나타납니다. 이것이 바로 마케팅 기술에서 5 년 전의 모습 중 하나입니다.
오늘의 견해로 가면 이것이 겉 모습이며 완전히 뚫을 수 없습니다. 이 브랜드와 옵션의 벽에 불과하며 데이터베이스 클래스에 있다고 간주되는 다양한 소프트웨어 조합으로 다양한 형태의 데이터를 캡처, 생성 또는 저장하고 검색 할 수 있습니다. 우리는 지금 매우 흥미롭고 용감한 시간을 보내고 있다고 생각합니다. 한때 당신은 주요 브랜드를 알 수 있었을 때 Oracle과 Informix, DB2 등에서 5-6 개의 다른 플랫폼을 알 수있었습니다. 약 20 년 전에 사용 가능한 모든 브랜드에 대한 전문가. 10 년 전에는 일부 브랜드가 떨어졌기 때문에 조금 더 쉬워졌으며 모든 브랜드가 닷컴 붐의 규모에 대처할 수있는 것은 아니었고 일부 회사는 막 파산했습니다.
오늘날 관계형 데이터베이스이든 지난 20 년 동안 우리가 알게 된 표준 데이터베이스 관리 플랫폼이든 관계없이 존재하는 모든 데이터베이스 기술에 대한 전문가가되는 것은 절대 불가능합니다. 또는 Neo4j와 같은 최신 엔진 및 해당 유형과 같은 경우가 있습니다. 그래서 우리는 많은 옵션을 사용할 수있는 매우 용감한 세상에 들어서고 있으며, 메모리 나 디스크에서 수평으로 플랫폼을 확장 할 수 있다고 생각합니다. 그러나 기술 및 비즈니스 의사 결정권자들은 기술 스택에 대해 매우 큰 결정을 내려야 할 필요가 있기 때문에 어려운시기라고 생각합니다. 18 개월 전은 더 흥미롭고 새로운 오픈 소스 데이터베이스 플랫폼에있어 무서운 숫자가 아닙니다. 그리고 플랫폼을 통합하기 시작하여 더욱 새롭고 흥미 진진 해졌습니다.
오늘은이 모든 것이 전통적인 데이터베이스 플랫폼에 어떤 영향을 미쳤는지, 어떻게 대응하고 있는지, 그리고 기술 유형에 대해 대화를 나눌 것입니다. 그리고 그 점을 염두에두고, 이제 로빈 블로어 박사에게 가서 그의 통찰력을 얻으려고합니다. 로빈.
로빈 블로어 : 좋습니다. 감사합니다. 예, 주제가 너무 큽니다. 데즈가 방금 보여준 삽화 중 하나를 조금만 먹었다면 은색 중 하나에 대해서만 긴 대화를 나눌 수 있습니다. 그러나 여러분은 데이터베이스를 이용할 수 있습니다. 저는 1980 년대 이후로 데이터베이스를 살펴 봤지만 모릅니다. 데이터베이스를 다른 방식으로 볼 수 있습니다. 그리고 제가 오늘 대화에 쏟을 것이라고 생각한 것 중 하나는 하드웨어 수준에서 파괴적인 일이 발생한 이유에 대해 이야기하는 것이 었습니다. 그리고 소프트웨어 수준에서도 실제로 많은 파괴적인 일이 발생했음을 명심해야합니다. 그래서 이것은 전체적인 그림이 아니라 하드웨어 일뿐입니다.
나는 특히 오랫동안 이야기하지 않을 것입니다. 나는 단지 하드웨어 그림을주고 싶었습니다. 데이터베이스는 CPU, 메모리 및 디스크에 걸친 데이터 검색 기능이었으며 그 변화는 극적으로 변화하고 있습니다. 그리고 내가 말하는 이유는 실제로 한 일의 관점에서 데이터베이스를 이해하는 것을 배웠기 때문입니다. 실제로 CPU에있는 데이터와 메모리에서 CPU로 가져 오는 데이터 및 디스크에서 메모리로 가져 오는 데이터 및 CPU를 통한 데이터간에 대기 시간에 차이가 있습니다. 그리고 오래된 데이터베이스 아키텍처는 그 균형을 맞추려고했습니다. 그들은“이것은 매우 느리게 진행됩니다. 우리는 디스크에 데이터를 캐시하여 메모리에 저장합니다. 우리가 요청하는 데이터의 상당 부분이 이미 메모리에 있도록 정말 정확한 방식으로 시도하고 수행 할 것입니다. 그리고 실제로 가능한 빨리 데이터를 CPU에 전달할 것입니다.”
그리고 데이터베이스는 예전에는 소규모 클러스터 용으로 작성된 머신으로 작성되었습니다. 그리고 지금, 병렬 처리의 무지에 대해. 클러스터에서 일부 성능을 얻으려면 다양한 작업을 병렬로 수행해야합니다. 병렬 처리는 게임의 일부이며 현재와 같은 것은 아닙니다. 난 그냥 무슨 일이 있었는지 걸을거야.
우선, 디스크. 디스크가 정말 끝났습니다. 데이터베이스와 관련하여 거의 끝났습니다. 데이터를 보관하는 데는 여러 가지 맥락이 있으며 하둡에서 실행되는 매우 큰 데이터 레이크조차도 요즘 최악의 회전 디스크는 실행 가능할 것입니다. 실제로 디스크 회전의 문제점은 읽기 속도가 특별히 향상되지 않았다는 것입니다. 그리고 CPU가 올라 가면서 무어의 법칙 속도는 6 년마다 더 빨라졌습니다. 그리고 기억은 일종의 깨달음에 뒤따 랐으며, 그 두 사람은 서로 합리적으로 속도를 유지하고있었습니다.
그러나 머리가 디스크 주위를 날아 다니는 디스크를 무작위로 읽습니다. 디스크에서 임의 읽기를 수행하는 경우 메모리에서 읽는 속도와 비교할 때 디스크 속도가 엄청나게 느리므로 100, 000 배 느립니다. 그리고 최근에 제가 깊이 살펴본 대부분의 데이터베이스 아키텍처는 실제로 디스크에서 연속적으로 읽었습니다. 어떤 방법 으로든 디스크에서 가능한 한 많이 캐시하고 느린 장치를 꺼내 빠른 장치에 넣기를 원합니다. 그리고 당신이 할 수있는 많은 똑똑한 일들이 있지만, 그것은 끝났습니다.
솔리드 스테이트 디스크 또는 플래시 드라이브는 실제로 회전 디스크를 매우 빠르게 대체하고 있습니다. 디스크에서 데이터가 구성되는 방식은 디스크 작동 방식에 따라 구성되기 때문에 다시 완전히 변경됩니다. 실제로 회전하는 표면을 가로 질러 움직이는 머리, 여러 개의 회전하는 표면을 가로 질러 움직이는 여러 개의 머리에 관한 것입니다. 솔리드 스테이트 드라이브는 읽을 수있는 블록입니다. 첫 번째는 모든 기존 데이터베이스가 디스크 회전을 위해 설계되었으며 이제 SSD를 위해 다시 엔지니어링되고 있다는 것입니다. 새로운 데이터베이스는 아마도 가능합니다. 지금 새로운 데이터베이스를 작성하는 사람은 회전 디스크를 무시하고 전혀 생각하지 않을 수 있습니다. 그러나 SSD의 주요 제조업체 인 삼성은 SSD가 실제로 무어의 법칙에 있다고 말합니다.
그것들은 디스크 회전보다 약 3-4 배 빠르지 만, 기본적으로 18 개월마다 훨씬 더 빨라질 것입니다. 속도는 두 배, 최대 약 6 년은 10 배입니다. 그러나 그것이 바로 그랬다면, 그것은 당신에게 잠시 후에 말할 것입니다. 회전 디스크는 물론 보관 매체가되고 있습니다.
메모리에 대하여. 우선, RAM. CPU 당 RAM 간의 CPU 비율은 항상 증가하고 있습니다. 물론 어떤 방식 으로든 더 많은 속도를 제공 할 수 있습니다. 현재 보유하고있는 에이커의 메모리는 훨씬 더 많이 저장할 수 있기 때문입니다. 이것이 실제로하는 일은 MLTP 종류의 응용 프로그램 또는 임의 읽기 응용 프로그램에 대한 부담을 줄이는 것입니다. 이제 많은 메모리를 확보했기 때문에 더 쉽게 처리 할 수 있으므로 그러한 모든 것을 캐시 할 수 있습니다 메모리로 읽을 수 있습니다. 그러나 데이터 힙이 클수록 문제가 발생하므로 실제로는 큰 데이터가 그렇게 간단하지 않습니다.
그리고 우리는 3D Xpoint를 갖춘 Intel과 위상 변화 메모리 인 PCM이라고 부르는 IBM을 통해 현재 SSD보다 10 배 이상 빠르다고 생각합니다. RAM과 같은 속도에 가깝습니다. 물론 저렴합니다. 이전에는이 CPU, 메모리 및 디스크의 데이터베이스 구조를 사용했으며 이제 4 계층 구조로 이동하고 있습니다. CPU, 메모리 또는 RAM이 있고 실제로 SSD는 메모리보다 비 휘발성 인 SSD보다 빠릅니다. 그리고 이러한 새로운 기술은 비 휘발성입니다.
그리고 7 년 전에 발표 된 HP 멤 리스터가 아직 나오지 않았지만 아직 나타나지 않았습니다. 그러나 소문에 따르면 HP가 멤 리스터로 게임을 약간 변경한다는 것만으로도 새로운 메모리 상황이 생겼습니다. 이것은 우리가 더 빠른 물건을 얻는 것과 같지 않습니다. 이것은 완전히 새로운 층을 가진 것과 같습니다. 그리고 SSD 액세스가 가능하다는 사실을 알게되었습니다. 많은 다른 회전 디스크가있는 경우를 제외하고는 회전 디스크를 병렬로 읽을 수 없습니다. 그러나 SSD 블록은 실제로 병렬로 읽을 수 있습니다. 병렬로 읽을 수 있기 때문에 단일 CPU에서 여러 프로세스에 걸쳐 여러 프로세스를 실제로 설정하고 SSD를 사용하면 간단한 읽기 속도보다 훨씬 빠릅니다.
그렇게하면 거의 RAM 속도에 도달 할 수 있다고 추정됩니다. 그리고 이것이 말하는 것은 메모리 아키텍처의 미래가 불분명하다는 것입니다. 현실은 다양한 주요 벤더들이 누구든지 하드웨어의 방향을 결정할 것이라고 생각합니다. 그러나 현재 시점에서 어디로 가는지 아무도 모릅니다. “어떤 일이 일어나고 있는지 두려워하지 않습니다.”라고 말하는 일부 데이터베이스 엔지니어와 이야기를 나 they지만, 시작부터 최적화하는 방법을 모릅니다. 그리고 당신은 항상 그런 종류의, 그래서 재미있다.
그리고 CPU가 있습니다. 멀티 코어 CPU는 단순한 멀티 코어 CPU가 아닙니다. 또한 L1, L2 및 L3 캐시, 특히 L3의 상당한 양이 있습니다. 거기에 많이 넣을 수 있습니다. 따라서 실제로 칩을 캐싱 매체로 사용할 수 있습니다. 그래서 게임이 바뀌 었습니다. 그리고 많은 공급 업체들이 실제로 벡터 처리 및 데이터 압축을 수행하여 CPU에서이 작업을 CPU로 드래그하여 CPU에서 훨씬 빠르게 진행되도록했습니다. 그렇다면 GPU가 장착 된 CPU가 분석 속도를 높이는 데 실제로 도움이된다는 사실을 알게됩니다. 그리고 그들은 특정 종류의 쿼리에 정말 능숙합니다. 쿼리에 따라 다릅니다.
CPU와 GPU가 장착 된 보드를 만들거나 AMD가 지금하고있는 것처럼 CPU와 GPU의 일종 인 APU를 생성합니다. 두 가지 기능을 모두 갖추고 있습니다. 그것은 다른 종류의 프로세서입니다. 그리고 인텔이 최근 발표 한 바에 따르면, 칩에 FPGA를 장착 할 것입니다. 그런 식으로 제 머리가 들어갔습니다.“어떻게 지구상에서 일어날까요?” CPU, GPU의 가능성과 CPU, FPGA의 가능성이 있습니다. 실제로 원하는 경우 동일한 보드에 CPU, GPU 및 FPGA를 넣을 수 있습니다. 실제로 어떻게 그런 식으로 운영 할 것인지는 모르겠지만 이와 같은 일을하는 회사는 알고 있으며 매우 빠른 쿼리 응답을 얻고 있습니다. 이것은 무시 될 것이 아니며, 기존 벤더들이 사용하게 될 것이며 아마도 새로운 벤더들이 사용하게 될 것입니다. DBMS는 항상 병렬 이었지만 이제 병렬 가능성이 폭발적으로 확장되었습니다.이를 통해 다양한 방식으로 병렬화 할 수 있기 때문입니다.
마지막으로, 스케일 업 또는 스케일 아웃? 스케일 업은 실제로 가장 좋은 솔루션이지만 한 가지입니다. 하나의 노드에서 디스크의 CPU 및 메모리 성능을 절대적으로 최적화 할 수 있으면 노드 성능이 훨씬 향상됩니다. 더 적은 수의 노드를 사용하므로 더 저렴할 것입니다. 그리고 관리하기가 더 쉬울 것입니다. 불행히도 하드웨어에 의존하는 디자인이며 하드웨어가 변경됨에 따라 엔지니어가 하드웨어가 변경되는 한 빨리 실행할 수 없다면 그렇게 할 수 없습니다. 또한 규모를 확장 할 때 작업 부하에 대해 다양한 가정을하고 있기 때문에 작업 부하 문제가 발생합니다.
수평 확장, 즉 아키텍처가 수평 확장 전에 수평 확장을 강조하는 경우 실제로 두 가지를 모두 수행해야하는 경우 하나만 강조하면됩니다. 그러면 아키텍처가이를 처리하므로 네트워크 성능이 향상됩니다. 더 많은 노드가 있기 때문에 하드웨어 측면에서 비용이 많이 들지만 워크로드 문제가 적고 더 유연한 설계가 될 것입니다.
실제로 하드웨어 변경 사항을 모두 생각하면 손가락을 겨냥한 다음 어떻게 생각하는지에 대해 어떻게 생각하십니까? 그런 다음 데이터베이스 엔지니어는 최소한 저임금을 받는다는 것을 알고 있습니다. 따라서 하드웨어 계층 만 고려하면 데이터베이스 문제가 분명합니다. 이제 나는 이것을 우리 모두에게 교육받은 느낌을 줄 수있는 Bert에게 전달합니다.
에릭 카바나 흐 : 그게 다야! 버트?
Bert Scalzo : 대단히 감사합니다. 이 슬라이드로 바로 들어가겠습니다. 나는 많은 슬라이드를 거쳐야하는데, 그들 중 상당수는 다소 빨리 갈 수 있습니다. 우리는이“순간 모멘텀 : 관계를 넘어 전통적인 관계”에 대해 이야기 할 것입니다. 그것은 더 이상 아버지의 데이터베이스가 아닙니다. 상황이 바뀌었고, 초기 연사가 말했듯이 지난 6-7 년 동안 풍경은 급격히 바뀌 었습니다.
나 자신은 80 년대 중반부터 데이터베이스를 사용하고 있습니다. Oracle, SQL Server, 벤치마킹 및 기타 몇 가지에 관한 책을 저술했습니다. “세상은 매우 빠르게 변하고 있습니다. 더 이상 크지 않을 것입니다. 그것은 느리게 치는 것입니다.”나는“적응하기 위해”추가했습니다. 그것은 Rupert Murdoch의 것입니다. 나는 이것이 사실이라고 정말로 믿는다. 10 년, 15 년, 20 년 전과 같은 방식으로 데이터베이스 작업을 수행 할 수 없습니다. 비즈니스가 원하는 방식으로해야합니다.
나는 내가 제시하고있는 것에 대해 약간의 일반적인 태도를 유지하려고 노력할 것이지만, 내가 말하고있는 대부분의 기능은 Oracle에서 발견되며 SQL Server, MySQL, MariaDB 및 기타 큰 기능에서 발견됩니다. 선수. 관계형 데이터베이스 혁명, 나는 이전 연설자들과 다시 동의합니다. 2010 년경을 보면, 빨간 경주 용 차에서 노란색 경주 용 차로갔습니다. 중대한 변화가 있었고 2020 년이되자 또 다른 급진적 인 변화가있을 것이라고 믿습니다. 우리는 매우 흥미로운 시간에 있습니다.
자, 이 슬라이드가 핵심입니다. 그래서 제가 그곳에 열쇠를 넣었습니다. 이 모든 변화가 진행되고 있으며, 왼쪽에는 기술이 있고 오른쪽에는 비즈니스가 있습니다. 그리고 문제는 어느 것이 어느 원인이며 어느 것이 어느 것을지지하고 있는가입니다. 디스크가 다운되거나 디스크 크기가 커지고 새로운 유형의 디스크와 같은 하드웨어 변경 사항이 있으므로 이전 스피커에서 다루었습니다. 모든 최신 버전의 데이터베이스에서 메모리 가격이 떨어집니다. 그러나 오른쪽에는 데이터 보호 및 규정 준수, 데이터웨어 하우징, 비즈니스 인텔리전스, 분석, 필수 데이터 보존 기능이 있습니다. 방정식의 양변이 구동되고 방정식의 양변이이 모든 새로운 기능을 사용하게됩니다.
우선, 우리는 전형적인 SAS 회전 디스크를 가지고 있으며, 현재 최대 10TB입니다. Western Digital의 HGST는 헬륨 드라이브라고하는 것을 보지 못했습니다. 현재 약 10 테라 바이트에 달합니다. 회전 디스크 비용이 꽤 낮아지고 있습니다. 앞에서 언급했듯이 최대 2 테라 바이트까지 솔리드 스테이트 디스크를 얻을 수 있지만 삼성은 20 테라 바이트 장치를 곧 출시 할 예정입니다. 비용이 합리화되고 있습니다. 내가 다른 것에 대해 이야기하지 않을 한 가지는 플래시 디스크의 개념입니다. PCIe, 즉 PCI Express와 NVMe는이 비 휘발성 메모리 표현에 대해 들어 본 적이 있거나 없을 수도 있습니다. 기본적으로 NVMe는 SAS 및 SATA를 대체 할 예정이며, 다른 어떤 것보다 실제로는 더 많은 통신 프로토콜입니다. 그러나이 디스크는 현재 최대 약 3TB입니다.
또한 일부 SAS 드라이브에는 표준 디스크를 사용하여 NVMe를 지원하는 SAS 또는 SATA와 다른 커넥터 인 U.2 커넥터가 제공되는 것으로 나타났습니다. 물론 디스크도 지원해야합니다. 그리고 M.2 커넥터가있는 SATA가 NVMe를 얻기 시작했습니다. 실제로 NVMe 플래시 디스크가 내장 된 노트북을 판매하는 노트북 공급 업체가 있으며, 이전에 사용했던 기술에 비해 비명을지를 것입니다.
많은 사람들이이 다른 섬광들이 무엇인지 모릅니다. 오른쪽 하단을 보면 M.2의 예입니다. “음, 왼쪽에 mSATA 드라이브와 매우 비슷해 보입니다.”그러나 보시다시피, 핀과는 반대로 두 개의 틈이 있고 조금 더 큽니다. 또한 M.2는 세 가지 크기로 제공 될 수 있습니다.
그런 다음 PCI Express 플래시와 NVMe 플래시가 있습니다. 이제 NVMe 플래시도 PCI Express이지만 PCI Express는 여전히 디스크 회전을 위해 작성된 SAS 또는 SATA 유형 컨트롤러 알고리즘이며 NVMe는 플래시를 위해 특별히 작성된 알고리즘 또는 기술입니다. 그리고 다시, 당신은이 모든 것을 보게 될 것입니다.
NVMe는 몇 가지를 제공합니다. 가장 큰 두 가지 개선 사항은 오른쪽 상단에서 대기 시간이 70 % 나 줄었다는 것입니다. 나는 실제로 그것보다 더 높은 것을 보았다. 또한 오른쪽 하단에서 운영 체제가 NVMe 디스크와 통신 할 때 훨씬 적은 수준의 소프트웨어를 거치게됩니다. 기본적으로 운영 체제에 포함 된 NVMe 드라이버를 통해 미디어와 직접 통신합니다. 이 기술이 데이터베이스 세계를 근본적으로 변화시키는 데는 많은 이유가 있습니다.
많은 사람들이“음, NVMe는 얼마나 빠릅니까?”라고 말할 것입니다. 2004 년과 그 이전의 좋은 시절, 우리는 초당 300MB의 Ultra-320 SCSI를 가지고 있다면 흥분했습니다. 오늘날의 속도는 많은 사람들이 아마도 섬유 또는 InfiniBand에 있으며 아마도 그런 종류입니다. 오른쪽의 NVMe는 현재 기술이 끝나는 곳에서 시작합니다. 내가 얻는 것은 8 레인 링크가있는 PCI Express 3.0이 거의 8000에서 시작하며 최신 버전의 PCI Express, 버전 4 등이 나올 때 올라갈 것입니다. NVMe는 위를 제외하고는 갈 곳이 없습니다.
자, 데이터베이스에서 어떤 변화가 있습니까? 이제 슬라이드의 오른쪽 상단에 기술이 등장했다고 생각하는 비즈니스 이유가 있습니다. 이 경우 데이터웨어 하우징과 필수 데이터 보존에 대한 규제 이유 때문에 데이터베이스가 압축을 시작하고 있습니다. 이제 일부 데이터베이스는 추가 기능으로 압축을 제공하고 일부는 표준에 기본 제공되는 압축을 제공합니다. 데이터베이스의 Enterprise Edition이라고 말하지만 Oracle과 같은 일부 데이터베이스는 더 나은 압축 버전을 가질 수 있습니다. 예를 들어 Exadata 플랫폼은 실제로 매우 특수한 압축을 지원할 수있는 하드웨어를 구축했으며 Exadata의 압축률은 40 배 압축률을 갖기 때문에 매우 중요합니다. 그리고 그것은 필수 데이터 보존이라고 생각합니다. 사람들은 데이터를 더 오래 원합니다. 비즈니스에는 분석 및 BI를 수행하기 위해 지난 5, 10, 15 년 분량의 데이터가 필요합니다.
이제 2008 년, 2009 년경에 나타나기 시작한 또 다른 기능은 파티셔닝이었습니다. 다시 말하지만, Oracle, SQL Server와 같은 데이터베이스 및 비용을 지불해야하는 두 데이터베이스에서이 사실을 알 수 있습니다. Oracle에서는 파티셔닝 옵션을 구입해야하며 SQL Server에서는 데이터 센터 에디션을 사용해야합니다. 그것은 전통적인 분할 및 정복 기술이며 당신이하는 일은 맨 위에 논리적 인 큰 테이블이라는 개념이 있으며 디스크에 놓이면 실제로 버킷으로 나뉩니다. 또한 이러한 버킷이 분리 기준으로 구성되어 있으며, 일반적으로 파티셔닝 기능을 참조하거나 호출 한 것을 확인할 수 있습니다. 마찬가지로 일부 데이터베이스 플랫폼에서 하위 파티션을 구성하여 더 나아갈 수도 있습니다.
다시 말하지만, 데이터웨어 하우징과 필수 데이터 보존으로 인해이 문제가 발생했다고 생각합니다.이 데이터베이스 중 일부에서는 최대 64, 000 개의 파티션을 가질 수 있으며 일부 다른 데이터베이스에서는 최대 64, 000 개의 하위 파티션을 믿습니다. 이를 통해 데이터를 관리 가능한 부분으로 나눌 수 있습니다. 또한 인덱스를 분할합니다. 옵션이므로 반드시 할 필요는 없지만 인덱스를 분할 할 수도 있습니다. 이를 수행하는 이유 중 하나는 슬라이딩 데이터 창이 있기 때문일 수 있습니다. 10 년 분량의 데이터를 유지하고 싶지만 오늘 밤의 일괄로드를 실행하기 위해 인덱스를 삭제하기 위해 모든 현재 행에있는 행에서만 인덱스를 삭제하지 않아도됩니다. 파티션 분할은 대부분의 사람들이 계획에서 파티션 제거를 포기하고 쿼리 속도를 높이는 것이 큰 이점이라고 생각하더라도 실제로는 매우 유용한 관리 도구입니다. 정말 케이크 위에 착빙하는 것입니다.
이제 샤딩에 대해 들어봤을 것입니다.“글쎄, 왜이 슬라이드를 여기에 넣었습니까?”이것은 NoSQL 중 하나입니다. 이것은 하둡 유형 환경 중 하나입니다. Oracle 12c는 G8이 아닌 두 가지를 출시했지만 실제로 표시되거나 미리보기되는 것은 샤딩이 있습니다. Oracle과 같은 전통적인 데이터베이스 시스템을 사용하고 Hadoop 모델에서와 마찬가지로 샤드를 만들 수 있으므로 분할 및 정복 기법을 사용하여 분할 할 수 있습니다. 노드별로 그룹화하여 행 단위로 테이블을 작성하면 이는 일부 NoSQL 데이터베이스에서 볼 수있는 것과 같습니다. 실제로 MySQL에서는 클러스터링 기술 중 하나를 사용하여 실제로이 작업을 거의 수행 할 수 있지만 기존 데이터베이스에오고 있으며 Microsoft가 뒤쳐두고 싶지 않을 것입니다. 이 두 게임은 항상 서로 개구리를 뛰어 넘어 다음 버전의 SQL Server에서 샤딩을 보게 될 것입니다.
데이터 라이프 사이클 관리, 다시 필수 데이터 보존, 비즈니스 인텔리전스 및 분석. 실제로 이것은 분할 및 정복 기법이며 일반적으로 DBA는 수동으로 수행합니다.“올해의 데이터는 빠른 디스크에 보관하고 작년의 데이터는 약간 느린 디스크에 보관할 것입니다. 지난 2 년 전까지는 더 느린 디스크에 보관 한 다음 보관 방법을 사용하겠습니다.”일반적으로 더 이상 테이프로 녹화되지 않으며 일반적으로 네트워크에 연결된 스토리지 또는 장치가 많은 장치가 있습니다. 스토리지 비용을 절감 할 수 있지만 비용 효율적이지만 여전히 디스크를 돌리고 있습니다.
이제 Oracle과 SQL Server 모두에서 실제로 규칙을 정의하는 옵션을 구입할 수 있으며 이는 백그라운드에서 자동으로 수행됩니다. 더 이상 스크립트를 작성할 필요가 없으며 아무 것도 할 필요가 없습니다. 6 월에 처음 나온 SQL Server 2016을 본 적이 있다면“Stretch Databases”라는 새로운 기능이 있습니다. 기본적으로 오른쪽 하단에서 여러 계층에서 클라우드로 직접 이동할 수 있습니다. 다시 말하지만이 기능은 데이터베이스에 내장 된 기능입니다. "데이터가 365 일이 지난 경우 클라우드로 이동하여 자동으로 수행하십시오."와 같이 말합니다.
이것은 정말 멋진 기능이 될 것입니다. 사실, 우리가 앞으로 보게 될 것이라고 생각합니다. 지역 데이터베이스를 유지할 하이브리드 데이터베이스가있을 것입니다. 그리고 일부는 구름에 있습니다. 그 전에 사람들은“아, 온 프레미스를 할 것인지 아니면 클라우드를 할 것인지”생각하고있었습니다. 이제 우리는이 하이브리드 방식으로 두 기술의 결혼을보고 있습니다. 나는 이것이 꽤 클 것이라고 생각하고 Microsoft는 먼저 거기에 도착했다.
편집, 이것은 데이터 보호 및 규정 준수 때문입니다. 예전에는 응용 프로그램 개발자가 보고서에 이것을 표시 할 때 화면에 표시 할 때 데이터를 표시하고 확인해야 할 몇 가지 보안 사항이 있습니다. 그들은 보지 말아야 할 데이터를 보거나 숨기거나 수정해야합니다.”물론, 평소와 같이 응용 프로그램으로 데이터를 푸시 할 때 한 곳에서 수행되지 않으므로 다르게 수행되거나 그렇지 않습니다. 어떤 곳에서는 끝나지 않습니다. 이제 데이터베이스 시스템에서이 기능을 사용할 수 있습니다.
이제 SQL Server 2016에는이 기능이 내장되어 있으므로 데이터 센터 추가에 아직 선택적인 비용 항목이 아닙니다. 그리고 Oracle 12에서는 수명주기 관리 애드온을 구매해야하지만 이는 새로운 것이며 비즈니스에 의해 주도되고 있습니다. 특히 지금 많은 양의 데이터를 유지하고 데이터 마이닝, BI 및 분석을 수행하고 있기 때문에 누가 어떤 데이터에 액세스하고 누가 무엇을 볼 수 있는지 확인해야합니다. 그들은 볼 수 있습니다.
마찬가지로 데이터 보호 및 규정 준수를 다시 살펴보십시오. 다이어그램에서 아래쪽 화살표와 위쪽 화살표를 보면 데이터베이스에 직접 암호화되어 데이터베이스에 직접 암호화되어 있으며이 암호화에 대해 중요한 것이 많은 데이터베이스 시스템에서 압축되고 있습니다. 디스크로 암호화 된 다음 메모리로 다시 읽고 해독합니다. 그것은 실제로 하나의 모델이며, 네트워크를 통해 해당 데이터를 실제 클라이언트 응용 프로그램과 통신 할 때만 실제로 수행하는 다른 모델이 있습니다.
이 경우에도 메모리의 데이터베이스 서버에서도 여전히 클라이언트 응용 프로그램으로 전송 될 때 암호화되고 해독 될 수 있습니다. 여기에는 두 가지 다른 모델이 있으며 데이터베이스에서이 모델을 찾을 수 있으며 실제로 최근에 추가 한 데이터베이스 중 하나는 버전 10.X의 MariaDB였습니다. 나는 그들이 지금 10.1 또는 10.2에 있다고 생각합니다. 실제로이 암호화에 대한 벤치마킹을 수행했으며이 암호화를 얻기 위해 처리량이나 속도가 약 8 % 감소했습니다. 벤치마킹 테스트에서 암호화는 그렇게 많이 발생하지 않았으므로 매우 유용한 기능입니다.
이제 플래시 메모리와 SSD 및 이와 유사한 것들에 대해 앞에서 언급했습니다. 많은 사람들이 인식하지 못하는 Oracle 및 SQL Server의 기능 중 하나는 데이터베이스 서버에있는 플래시 또는 SSD를 가져 와서 데이터베이스에 다음과 같이 말할 수 있다는 것입니다. RAM을 우선적으로 취급하되, 메모리가 느린 것으로 가정하고이를 확장 캐시로 사용하십시오.”이제 SQL Server 2014에서는 이것이 "버퍼 풀 확장"이라고 불리며 무료입니다. Oracle에서는 11g R2로 출시되었으며 "데이터베이스 플래시 캐시"라고도하며 무료였습니다.
그러나 내 조언은이 기능을 신중하게 테스트하는 것입니다. 조회를 수행 할 때 캐시를 더 크게 만들 때마다 시간이 더 걸립니다. 3 테라 바이트 크기의 플래시 카드를 넣고 데이터베이스에“메모리에 추가”라고 말하면 실제로 살펴 보거나 플래시로 보는 시간으로 인해 속도가 느려지는 것을 발견 할 수 있습니다. 깨끗한? 수익이 감소하는 시점이 있습니다. 내 충고는 이것을 다시 테스트하고, 당신에게 맞는 것이 무엇인지 알아 보는 것이지만, 다시 데이터베이스와 오라클의 경우 SQL Server와 Oracle의 경우 몇 년 동안 존재했습니다.
그리고 그것은 우리를 인 메모리 데이터베이스였던 할아버지에게 데려옵니다. 데이터베이스 가격이 하락했기 때문입니다. 아마도 이런 일이 발생했다고 생각하는 다른 이유는 많은 분석이 데이터에 매우 빠르게 액세스 할 수 있어야하므로 메모리에 있어야한다는 것입니다. 데이터베이스가이 데이터에 액세스하고 압축하고 암호화하고 저장하기 위해 사용하는 알고리즘은 경우에 따라 일부 데이터베이스는 계속해서 인 메모리를 행으로 저장할 수 있습니다.
경우에 따라 일부 데이터베이스는이를 열 지향으로 분류 할 수 있으며 그 이유는 열 순서 대 행 순서로 저장하여 11 ~ 12 배 정도의 압축 수준을 달성하기 때문입니다. 이것은 SQL Server 2014에서 처음 나타 났으며 "Hekaton"이라고 불렀습니다. SQL Server 2016에서는 급격히 증가했으며 이름이 다른 이름으로 참조되어 Oracle 12c에서 나왔습니다. R2가 아닌 두 번째 릴리스를 말합니다. Oracle 12c에는 12.1.0.1과 12.1.0.2의 두 가지 릴리스가있었습니다. 데이터베이스의 R1 버전의 두 번째 릴리스입니다.
그리고 메모리 내 객체를 정의하는 방식은 두 데이터베이스에서 비슷합니다. 여기 오른쪽 상단에서 SQL Server를 만들고 있는데 메모리 최적화와 내구성이 스키마에 불과하다는 것을 알 수 있습니다. 나는이 모든 구문 의미를 다루지 않을 것입니다. 오라클에서는 실제로 훨씬 더 간단합니다. 테이블을 변경하고 메모리 내에서 말하거나하지 않고 변경할 수 있습니다. 오늘은 메모리에 있고 내일은 그렇지 않다고 말할 수 있으므로 매우 유연합니다.
메모리 내 테이블을 사용하여 Oracle에서 몇 가지 테스트를 수행했으며 최상위 행에서 실행하는 데 거의 40 분이 걸리는 테스트가있었습니다. 이제 중요한 것은 맨 아래 두 줄에 도달했을 때, 런타임을 늘리거나 줄였습니다. 약 5 분 정도 말해야합니다. 압축 계수를 볼 때 실제로 메모리의 데이터는 3.6이었습니다. 4.6 배 작아졌습니다. 이 경우 열 중심 형식을 사용하고 압축하기 때문에 중요합니다. 그리고 무엇을 추측합니까? 실제로 메모리에 거의 4 배에서 5 배 많은 데이터를 수용하고있었습니다. 메모리 내 이점, 열 지향적 이점, 메모리 캐시에있는 데이터의 최대 5 배에 달하는 훨씬 더 많은 데이터의 이점을 얻을 수 있었으므로 이는 매우 강력한 기술입니다. Oracle과 SQL Server를 다시 한번 살펴보면, 정말 멋진 기능입니다. 그리고 그것으로, 나는 그것을 질문에 열 것이라고 생각합니다.
에릭 카바나 흐 (Eric Kavanagh) : Well Bert, 우선 여러분은이 훌륭한 교육에서 매우 이타 적이었습니다. 너희들이하는 일에 대해 잠깐 얘기해 줄 수 있니? 당신이 말하고있는 것을 촉진 할 수있는 몇 가지 기술이 있기 때문입니다. 여러분이하는 일에 대해 잠시 이야기를 한 다음 여기 방정식에서 Dez와 Robin을 쓰러 뜨리겠습니다.
Bert Scalzo : 네, 저는 IDERA라는 회사에서 일합니다. 우리는 텍사스에 있고, 휴스턴에 본사를두고 있으며, 저는 실제로 지금 오스틴에 앉아 있지만 달라스에 있습니다. 데이터베이스 도구를 만들고 문제를 해결하는 데 도움이되는 데이터베이스 도구를 만듭니다. 이 문제는 생산성만큼이나 간단 할 수 있습니다.이 경우 데이터베이스 관리 작업을 수행 할 수있는 DBArtisan이라는 도구가 있으며 12 개의 서로 다른 데이터베이스 플랫폼을 관리 할 수있는 도구입니다. SQL Server를 관리하고, Oracle을 관리하고, MySQL, DB2, Postgres를 관리 할 수 있으며, 하나의 도구, 하나의 실행 파일, 하나의 GUI 디자인 및 하나의 일관된 워크 플로 세트를 사용하고 있습니다. 또한 규정 준수를위한 도구를 만들고 규정 준수 요구 사항을 충족하는 데 도움이되는 SQL Compliance Manager라는 도구가 있습니다. SQL Security라는 또 다른 도구이므로 효과적이고 효율적으로 사용할 수있는 도구를 만들려고 노력하고 있으며 웹 사이트를 방문하면 정말 멋진 점이 있습니다. 프리웨어가 많이 있습니다. – 우리는 프리웨어가 20 ~ 25 개 정도 있다고 생각합니다. SQL Server 및 Windows 도움말 확인과 같은 훌륭한 프리웨어 항목이 있습니다. 기본적으로 문제가있는 것을보고 문제가 있는지, 완전히 무료인지 알려줍니다.
에릭 카바나 흐 : 그리고 당신은 정말
Bert Scalzo : 확실히 첫 번째 것 -
에릭 카바나 흐 (Eric Kavanagh) : 오늘날 시장의 이질성에 대해 이야기하고 있습니다. 실제로 2005 년에 마이클 스톤 브레이커 박사를 인터뷰 한 것을 기억하는 한 가지 크기의 방정식이있었습니다. 컬럼 지향 데이터베이스 이동에 대한 평결에 대해 큰 압박을 가졌으며 단일 크기의 모든 관계형 모델이 수년 동안 어떻게 지배했는지에 대해 모든 것을 이야기하고 있었으며 모든 것이 변할 것이라고 예측하고 있었고 소년은 맞았습니다. 그. 이제 우리는 다양한 옵션과 기회가있는이 다양하고 흥미로운 환경을 가지고 있지만, 당신은 그 모든 것을 관리 할 누군가가 필요합니다. 귀하의 회사는 수학 문제를 해결하는 데 매우 집중하여 이기종 헤더, 맞습니까?
버트 스 칼조 : 물론입니다. “GUI 도구를 사용하고 싶지 않고 스크립트로 모든 작업을 수행합니다.”라고 말하는 DBA가 항상있을 것입니다. 그들은 수퍼맨 유형의 DBA라고 생각하지만 괜찮습니다. 대부분의 사람들은 일을 끝내고 싶습니다. Microsoft Word를 사용하여 문서를 작성합니다. Microsoft Outlook을 사용하여 전자 메일을 수행합니다. 작업을 수행 할 수있는 도구가 있습니다. 우리는 같은 종류의 개념을 구축하고 있으며 데이터베이스 관리자와 개발자가 원하는 방식에 초점을 맞출 수 있도록 도구를 구축하고 있습니다.
Eric Kavanagh : 말이 되겠지만, 전문가들에게 맡기겠습니다. 사람들은 자유롭게 뛰어 들게됩니다. 청중으로부터 몇 가지 의견이 접수되었습니다. 아마도, Dez, 몇 가지 질문과 Robin 두 가지 질문?
Dez Blanchfield : 물론입니다. 내가 경험 한 엄청난 경험을 감안할 때, 내가 당신에게 던지고 싶은 첫 번째 질문 중 하나가이 중 하나가 느려지는 시점을 곧 알 수 있습니까? 아니면 우리가이 지속적인 성장 라인의 진입 점에 있다고 생각하십니까? 저는 회사가 직면하고있는 가장 큰 문제 중 하나라고 생각합니다. 그런 다음 비즈니스를 운영하기 위해 회사에 제공되는 기술을 지원하려는 사람들은 변화 속도가 너무 극적으로 높아서 모든 것을 따라 잡을 수 없다는 것입니다 다양한 기능, 소프트웨어, 시스템, 프레임 워크, 아키텍처, 새로운 코드가 등장하고 그 아래에있는 하드웨어가 현재의 변경 속도가 즉시 느려지고 있는가? 내 말은, 당신은 전체 IDERA 제품군과 같은 광범위한 플랫폼을 다루고 있습니다. 우리는 곧 속도를 늦출 것입니까, 아니면이 미친 런 어웨이화물 열차에 아직 오랫동안 있습니까?
버트 스 칼조 (Bert Scalzo) : 저는 우리가 그 성장 곡선의 처음 20 %에 있다고 생각합니다. 우리는 갈 길이 멀고 추진해야 할 두 가지가 있습니다. 기술은 계속 발전하고 있습니다. 당신은 나올 새로운 메모리 유형 중 일부를 언급했습니다. 그것은 환상적입니다. 삼성은 곧 20 테라 바이트 규모의 플래시 드라이브를 출시 할 예정이다. 그것은 변화 할 것입니다. 우리는이 모든 NoSQL과 클라우드 데이터베이스를 가지고 있으며, 계속 진행될 것입니다. 그러나 재미있는 점은 Oracle 및 SQL Server와 같은 데이터베이스와 다른 데이터베이스를 볼 때 더 이상 관계형 데이터베이스가 아니라는 것입니다. 비정형 데이터를 Oracle에 넣을 수는 있지만 ACID 준수를 유지할 수 있습니다. 만약 당신이 20 년 전에 나에게 말 했었다면, 나는 단지 당신이 약을 복용하고 있다고 말했을 것입니다.
Dez Blanchfield : 그렇습니다, 그들은 시원합니다. 이제는 GIS와 같은 멋진 틈새 시장을 가진 엔진조차도 기본 기능보다 훨씬 뛰어납니다. DBA가 직면 한 과제와 DBA의 다양한 시대에 대해 많은 의견을 냈지만, 현재 다루고있는 비즈니스 계층의 종류는 어떻습니까? 내 말은, 진단 관리자, 인벤토리 도구, 조각 모음으로 인해 DBA가이 변경에 어떻게 대처하고 어떻게 분류하는지에 이르기까지 다양한 플랫폼을 사용하는 사람들입니다., 그들은 당신의 도구로 무엇을하고 있습니까?
Bert Scalzo : 음, 저는 거의 20 년 전에 돌아가서 DBA가 조직에서 매우 특정한 역할을 해결한다고 말할 것입니다. 이들은 일반적으로 하나의 데이터베이스 플랫폼에서 작동하며 두 개일 수 있으며 비교적 적은 수의 데이터베이스를 관리합니다. 이제 오늘과 데이터베이스 관리자에게 빨리 넘어 가면서 실제로 10 개의 데이터베이스 플랫폼을 알게됩니다. 그는 관리하고 있으며, 일부 경우 수천 개의 데이터베이스가 농담이 아닙니다. 그것은 SQL Server 세계 또는 MySQL 세계에 관한 것입니다. 그러나 여전히 Oracle 세계에서는 수백 개의 데이터베이스를 관리 할 수 있습니다. 그리고이 새로운 기능들이 모두 나오고, 새로운 플랫폼이 있으며, 담당하는 모든 데이터베이스가 있습니다. 그들은 생산성을 높이고 일부를 배우는 데 도움이되는 도구를 찾고 있습니다.
그리고 테이블을 분할하고 싶을 때는 구문이 모호하고 하위 분할을 원하면 구문이 더욱 어려워집니다. 내가하고 싶은 일을 알고 버킷을 만들고 싶습니다. DBArtisan과 같은 툴을 가지고 있다면“이봐 요. 여기에는 작업을 수행하는 방법보다는 수행하려는 작업에 집중할 수있는 멋진 화면이 있습니다. 완료되면 SQL 버튼을 보여 주면 SQL이 무엇인지 보여 주므로 실제로 배우고 마스터 할 수 있습니다.”
DBA는 업무를 수행하는 데 도움이되는 도구를 찾고 있지만 사용중인 새로운 내용을 모두 가르치는 데 도움이되는 도구를 찾고 있습니다. 제가 Oracle 사람이고 MySQL로 가서 “알겠습니다. DBArtisan 데이터베이스를 만드십시오. 이제 MySQL에서 데이터베이스를 만드는 것이 어떤지 궁금하고 구문을 배웠기 때문에 SQL을 보여주세요.”따라서 데이터베이스 전체에서 작업하는 데 도움을 줄뿐만 아니라 데이터베이스 간에도 교육하고 있습니다.
Dez Blanchfield : 좀 더 현대적이거나 현대적이지 않은 것은 아닙니다. 그러나 한때 데이터베이스는 데이터베이스입니다. 요즘 나는 우리가 전통적으로 벤더들이 볼 수있는 기술 스택과 오픈 소스와 같은 좋은 기술에 대한 도전과 더불어 여러분이 말하는 모든 것을 볼 수 있습니다. 데이터베이스 엔진과 쿼리 언어를 다루는 것뿐만 아니라 구조화되고 구조화되지 않은 데이터 유형도 처리합니다. 페타 바이트 급 HDFS 스펙트럼의 끝에서 모든 것을 처리해야하는 문제가 있습니다. 작은 컨테이너, 패킷 파일 및 다양한 로그 파일 형식으로
그리고 저는 그것이 지금 우리가보고있는 것이라고 생각합니다. 수퍼맨, 수퍼 우먼, 그들이 생각하는 것, 육체적으로, 그 정도의 변화를 정신적으로 처리 할 수없는 사람, 변형의 규모. 현재 제공하는 도구 모음은 여러 가지 방법으로 기본 세트에 거의 도달 할 시점에 도달하여 물리적으로 인해 데이터베이스 환경이 없어도 실행할 수 없습니다. 그들에게 많은 시체를 던질 수 없습니다. 나는 당신의 프리젠 테이션을 정말로 즐겼습니다. 로빈 블로어 박사에게 전달할 것입니다. 그가 당신에게 던질 많은 질문이 있다고 확신합니다.
로빈 블로어 : 알겠습니다. 글쎄, 나는 확실히 질문이있다. Bert, 어디로 가는지 모르겠습니다. 며칠 전에 누군가가 최신 DU 데이터 보호에 대해 이야기하기 시작한 흥미로운 대화를 나 and습니다. 그들이 주장한 것들의 관점에서 draconian. 당신이 실제로 그것을 보았는지 궁금합니다. 익숙한가요?
버트 스 칼조 : 물론입니다. 네.
로빈 블로어 : 2016, 알겠습니다.
Bert Scalzo : 그리고 실제로 -
로빈 블로어 : 정말 흥미 롭습니다.
Bert Scalzo : 실제로 데이터베이스 영역에서 플래시 공급 업체를 위해 일하면서 데이터베이스 용 플래시 제품을 만드는 데 도움을 주었으며, 드라코 니안이 완전히 무너 졌다고 말할 수 있습니다. 내 말은 내 슬라이드 하나를 기억하면 일부 데이터베이스에서는 암호화를 수행하지만 서버 메모리 및 일부 데이터베이스에는 암호화를 넣습니다. 여전히 서버 메모리에 암호화되어 있으며, 다음과 같은 경우에만 해독됩니다. 클라이언트로 전송됩니다. 또한 미국 정부의 국방부 나 군대와 같은 정부 표준 중 일부는 플래시 수준까지 내려 가며 암호화 및 암호 해독을 지원한다는 것만 알고 싶지는 않습니다. 당신의 하드웨어, 그러나 누군가가 칩을 훔친 경우 – 당신이 알고있는 것, 서버에서 그것들을 뽑아 내고, 암호화 된 것을 가지고 있기 때문에 그들이 가질 수없는 스토리지를 가지고 있더라도 플래시 부분 자체가 아니라 개별 칩에 이르기까지 실제까지 줄어 듭니다. 그들은 칩별로 칩을 알고 싶었고 모든 것이 암호화되었습니다.
로빈 블로어 : 와우. 나는 당신이 이것에 대해 제기 한두 개의 슬라이드 일뿐이라고 생각하지만 실제로 흥미로운 시나리오라고 생각합니다. 예를 들어 정보의 수정은 특히 오늘날 기계 학습을 통해 이전에는 드러 낼 수 없었던 정보를 드러 낼 수있는 연역적 인 일을 할 수 있기 때문에 다양한 분야를 가리는 것보다 약간 영리해야합니다.
당신이 건강 정보를 보호하려고 노력한다면, 그것은 미국에서 건강 정보와 관련하여 매우 매우 엄격한 규칙이지만 실제로 다양한 기계 학습 기술을 사용하여 누군가의 의료 정보를 누가 해결할 수 있습니까? 실제로입니다. 나는 그들이 당신이 흥미로운 부분이라고 생각하기 때문에 그것에 대해 할 말이 있는지 궁금합니다.
Bert Scalzo : 네, 물론, 저는 이것을 예제로 사용하고 있습니다. 한 데이터베이스가 다른 데이터베이스보다 낫다고 말하려고하지는 않습니다. 그러나 이것은 방금 요청한 것에 대한 아주 좋은 예입니다. Oracle에서 John Smith 의료 기록을 볼 수없는 것처럼 예를 들어 데이터 행을 볼 수없는 경우 Oracle에서 "그 레코드를 선택하십시오"라고 말하면 차단되거나 볼 수있는 내용을 볼 수 있으며 수정 될 것입니다. "John Smith와 같은 테이블에서 계정 별을 선택하십시오"라고하면 0이됩니다.
SQL Server에서는 수정 작업을 수행 할 수 있지만 몇 가지 구멍이 있습니다. “John Smith와 같은 테이블에서 계정 스타를 선택하십시오.”라고 말하면 실제로 하나를 다시 얻게되므로 John Smith가 있음을 알 수 있습니다. 하나는 다른 것보다 더 안전합니다. 이제 저는 그들이 고치길 기대합니다. 그들은 항상 서로 뛰어 넘는 개구리를칩니다. 그리고 다시 한 번, 예를 보여주기위한 것 이외의 데이터베이스를 구별하려고하지 않습니다. – 지금 이야기하고있는 것을 살펴보십시오. 엄밀히 말하면 일부 계정은 기술적으로도 수정으로 인해 잘라야합니다. 말하자면, 행의 존재 외에는 아무것도 개정되지 않습니다.
로빈 블로어 : 네. 재미 있네요. 시간이 없어서 또 다른 일반적인 질문은 실제로 개선에 관한 것입니다. 나는 당신이 당신이 우리에게 당신이 실행 한 다양한 테스트 결과의 예를 보여주고 있다는 것을 알고 있다는 것을 알고 있다는 것을 의미합니다. – 전통적인 데이터베이스를 지배 데이터베이스라고 부릅니다. SQL Server와 Oracle, 당신은 그들이 완성을 앞설 것이라고 생각하십니까? 아니면 그들이 실제로 시장에 내놓는 다양한 종류의 혼란에 빠질 것이라고 생각하십니까? 당신의 의견은 무엇입니까?
Bert Scalzo : 저는 의견이 있습니다. 다시 말하지만 저는 다시 제 의견이라고 말할 것입니다. 예를 들어, 볼머 시대의 마이크로 소프트는 살아 계신 지옥에 감동을주었습니다. 이 확장 데이터베이스는 Linux에서 SQL Server를 받고, Linux에서 .NET을 받고, Linux에서 PowerShell을 가져옵니다. 기존 데이터베이스 공급 업체가 뒤쳐 질 것이라고 생각하지 않습니다. 나는 그들이 결정했다고 생각합니다.“이봐, 새로운 사람들, 신생 기업들이 무언가를 정의하게 해주세요. 샤딩이 무엇인지, 어떻게 완성해야하는지 파악하고, 모든 연구 개발을 완료 한 후에는 사용자가 원하는 것을 정확히 알고 이제 샤딩을 Oracle에 추가하겠습니다.”라고 생각합니다. "이봐 요, 당신이 지배적 인 선수 일 때는 사람들이 당신을 떠나지 않기 때문에 두 번째 또는 세 번째가 나쁘지 않습니다."
로빈 블로어 : 예, 사용 된 전략이라는 뜻입니다. 나는 IBM이 그와 전체를 수행 했었다는 것을 의미합니다. 전체 제품 범위에서 누군가가 전혀 생각하지 못한 벽에서 완전히 벗어난 것을 떠 올릴 때까지는 합리적으로 잘 평가하지만 계획을 세울 수는 없습니다. 어쨌든
청중의 질문, 에릭?
에릭 카바나 흐 : 예, 하지만 당신은 아마 한 번만 생각하고 버트가 달려야한다는 것을 알고 있습니다. 여기에 Oracle 12c의 샤딩 아키텍처에 대한 내용이 있습니다. 귀하의 의견으로는 무엇을 의미 하는가?
Bert Scalzo : Oracle은 다른 모든 데이터베이스 공급 업체의 모든 것을 흡수하거나 제공하고 있습니다. 예를 들어, 비정형 데이터를 Oracle에 넣을 수 있습니다. 구조화되지 않은 데이터를 넣은 다음 관계형 데이터베이스라고하는 방법을 모르므로 이해가되지 않지만 할 수는 있습니다. 이제 오라클은 샤딩을 추가하고 있습니다. 따라서 오라클은 다음과 같이 말합니다. 시장이 원하는 것이 무엇이든, 시장이 원하는 것을 원하고 솔루션을 제공하기를 원하므로 우리는 데이터베이스를 제공 할 것입니다.”
추가 항목이 표시 될 것 같습니다. Oracle 랙이나 실제 응용 프로그램 클러스터가 아니라 기본적으로 해당 샤딩을 수행하는 전통적인 Hadoop 유형 클러스터링에서 Hadoop과 같은 데이터베이스 노드 클러스터링을 보더라도 놀라지 않을 것입니다. 하둡처럼 Oracle과 같은 데이터베이스를 배포 할 수있을 것으로 생각되며 이러한 추세는 계속 될 것입니다. 이 큰 데이터베이스 공급 업체는 수십억 달러를 벌고 시장을 잃고 싶지 않기 때문에 어떤 것에 적응하거나 어떤 것도 채택하려고합니다.
에릭 카바나 흐 (Eric Kavanagh) : 오픈 소스 벤더를 꽤 오랫동안 따라 왔고 전통적인 닫힌 문 기술에 미치는 영향이 얼마 동안인지 궁금해했기 때문에 재밌습니다. 오픈 소스 벤더들이 진지한 진전을 보이고있는 것처럼 느껴졌고 이제는 시장을 살펴보면서 여러분이하는 말을 보았습니다. 큰 사람들이 수학을하고 연필을 날카롭게했으며 그 방법을 알아 냈습니다. 그들은 많은 것들을 그들의 아키텍처에 짜 넣을 수 있습니다. IBM이든 오라클이든 SAP이든 상관없이 저는 지난 달 SapphireNow 컨퍼런스에 참석했고 그 회사의 절반을 책임지고있는 Steve Lucas는 SAP가 HANA 클라우드 플랫폼에 통합하고 있다고 밝혔습니다. 경쟁사. 당신이 그것에 대한 수학을하면, 그것은 매우 인상적인 진술이며 큰 사람들이 곧 아무데도 가지 않을 것이라고 나에게 이야기합니다.
버트 스 칼조 : 아니요, 둘 다 내 돈을 걸었습니다. 내 말은, 마이크로 소프트의 주식이 최근에 약 $ 50 였고 몇 년 전만해도 25 년 이었다는 것을 의미합니다. 좋은 일을하지 않으면 단기간에 주식 가격을 두 배로 올리지 않을 것입니다. Windows 10부터 1 년 동안 무료로 제공되는 것부터 수행중인 다른 모든 스마트 작업에 이르기까지 모든 것을 수행하는 것은이 확장 데이터베이스 기능이 경이로운 것입니다. 앞으로 일어날 일은 많은 사람들이 "내 데이터베이스를 Azure로 마이그레이션 해 보자"라고 말한 것이 아니라 직접 Azure가 아닌 Azure에서 끝나는 것입니다. 그것은 보관 될 것이기 때문에 마법으로 마이그레이션 할 것입니다. 이 새로운 확장 데이터베이스 기능을 사용하여 Azure의 채택이 급증 할 것입니다.
Eric Kavanagh : 시장에서도 맥에서도 볼 수있는 트렌드 중 하나입니다. Mac에서 문서를 저장하기 위해 문서를 저장하면 최신 Mac이 바로 클라우드를 따라갑니다. 그 전략에는 많은 의미가 있으며, 전략도 살펴 보았습니다.“좋아요. 여러분은 클라우드 환경에 한 조각 씩 나를 유혹하고, 언젠가는 영화를보고 싶을 때 신용 카드 유효 기간이 만료되었습니다.”
버트 스 칼조 : 네, 하지만 당신은 페이스 북에서 하죠.
에릭 카바나 : 네. 사실입니다.
Bert Scalzo : Facebook에 모든 것을 넣습니다.
에릭 카바나 : 글쎄요.
버트 스 칼조 : 아니요.
에릭 카바나 흐 : 예.
버트 스 칼조 (Bert Scalzo) : 이러한 소셜 트렌드는 비즈니스에 도달하고 있습니다. 이제 기업은 여전히해야 할 일이 많이 있지만 이러한 추세를보고 있으며 같은 종류의 일을하고 있습니다. Oracle이나 Microsoft가 사라지는 것을 보지 못했습니다. 실제로, 나는 하락이있을 때마다 두 가지 모두에서 주식을 구매할 것입니다.
에릭 카바나 흐 : 그렇습니다. 여러분, idera.com, IDERA dot com으로 이동하십시오. Bert이 말했듯이, 그들은 거기에 많은 무료 물건을 가지고 있으며 그것은 시장에서 새로운 트렌드 중 하나입니다-당신에게 놀 수있는 무료 물건을주고, 당신을 사로 잡은 다음 당신은 진짜 물건을 사러갑니다.
여러분, 이것은 또 다른 뜨거운 기술이었습니다. 오늘 시간을 내 주셔서 감사합니다. Bert, Dez, 그리고 Robin도 마찬가지입니다. 다음 주에 얘기하겠습니다. 여러분, 많은 일들이 벌어지고 있습니다. 당신이 어떤 아이디어가 있다면, 진정으로 이메일을 보내 주시기 바랍니다. 다음에 얘기 할게요. 안녕.