ja

技術専門家のためのDataiku

大規模な機械学習のための迅速な実験と運用可能化。

ストレージとコンピューティングに依存しない

Dataiku はAmazon Web Services (AWS)、Google Cloud Platform (GCP)、Microsoft Azure でサポートされているのインスタンスを使用しオンプレミスやクラウドで実行可能です。各クラウドの ストレージやさまざまな計算レイヤーを統合します。

あらゆる IDE や Git に対応

Dataiku は接続性の問題の管理不要でデータソースに透過的にアクセスでき、Python、R、Julia、Scala の統合開発環境を提供します。Dataikuの活用方法は、

  • 「Notebook」スタイルで (Jupyter Notebook)
  • 「Visual Flow」スタイルで (ツールにグラフィック表示される計算フロー作成)
  • 独自のIDE (SublimeText, Visual Studio) をプラットフォームに接続

開発のすべてが Git で管理可能です。

Spark & K8S Clusters: フルマネージド (大規模環境)

Dataiku は既存のSpark や Kubernetes クラスタの活用や、独自のクラスタの作成・管理 もできます (クラウドプラットフォームの活用)。

Dataiku プラグイン使ったパワフルなエクステンション

Dataiku プラグインにより開発者は Python や Java を 使ってすぐに使える強力な拡張機能を構築し、プラットフォームのあらゆる部分をコントロール・拡張できます。Dataiku プラグインは Dataiku 内での新しいデータ・ソースへの接続、非プログラマーのための新しいアルゴリズムの視覚提供およびカプセル化、ITプロセスの統合などを支援します。Dataiku は APIを介してさらに拡張し Jira や Jenkins と統合できます。

エンドツーエンドの堅 牢なデータアーキテクチャを構築

Dataiku アーキテクチャは、既存技術への計算のプッシュダウンを体系化するパターンを中心に構築され、データアーキテクトが自身の堅牢なデータアーキテクチャを構築できるすべてのビルディングブロックを提供します。

  • 基礎となるデータソースの変更からアーキテクチャを保護するデータバリデーター。
  • バッチデータパイプラインとリアルタイムモデルスコアリングの双方で、自動スケール、 バージョン管理、ロールバックによる堅牢な導入が可能です。
  • 効率的な増分データ再計算用スマートデータ再構成エンジン。

 

何千ものモデルを作成し一番良いモデルを見つける

Dataiku AutoML を活用し、複数のアルゴリズムとパラメータの自動テストで、クラス最高モデルを素早く作成します。または独自のカスタムモデル作成や高度な深層学習モデルの使用など、すべてのトレーニング設定、アルゴリズム設定、および最適化プロセスを完全に管理可能です。

Dataiku は最もよく使われている機械学習エンジンを4つ—(Python、Spark、H2O、TensorFlow )サポートします。 また、32 種類以上のコアアルゴリズムがあります。

API で自動化・監視

Dataiku はプラットフォームのセットアップ、管理、また展開用の広範なAPIを提供します(完全なソリューションや新サービス導入の自動化を含む)。管理機能拡張により、既存の監視 IT スタック内に Dataiku を統合できます。