技術専門家のためのDataiku

ストレージとコンピューティングに依存しない

Dataiku はAmazon Web Services (AWS)、Google Cloud Platform (GCP)、Microsoft Azure でサポートされているのインスタンスを使用しオンプレミスやクラウドで実行可能です。各クラウドのストレージやさまざまな計算レイヤーを統合します。

あらゆる IDE や Git に対応

Dataiku は接続性の問題の管理不要でデータソースに透過的にアクセスでき、Python、R、Julia、Scala の統合開発環境を提供します。Dataikuの活用方法は、

「Notebook」スタイルで (Jupyter Notebook)
「Visual Flow」スタイルで (ツールにグラフィック表示される計算フロー作成)
独自のIDE (SublimeText, Visual Studio) をプラットフォームに接続

開発のすべてが Git で管理可能です。

Spark & K8S Clusters: フルマネージド (大規模環境)

Dataiku は既存のSpark や Kubernetes クラスタの活用や、独自のクラスタの作成・管理もできます (クラウドプラットフォームの活用)。

Dataiku プラグインにより開発者は Python や Java を使ってすぐに使える強力な拡張機能を構築し、プラットフォームのあらゆる部分をコントロール・拡張できます。Dataiku プラグインは Dataiku 内での新しいデータ・ソースへの接続、非プログラマーのための新しいアルゴリズムの視覚提供およびカプセル化、ITプロセスの統合などを支援します。Dataiku は APIを介してさらに拡張し Jira や Jenkins と統合できます。

エンドツーエンドの堅牢なデータアーキテクチャを構築

Dataiku アーキテクチャは、既存技術への計算のプッシュダウンを体系化するパターンを中心に構築され、データアーキテクトが自身の堅牢なデータアーキテクチャを構築できるすべてのビルディングブロックを提供します。

基礎となるデータソースの変更からアーキテクチャを保護するデータバリデーター。
バッチデータパイプラインとリアルタイムモデルスコアリングの双方で、自動スケール、バージョン管理、ロールバックによる堅牢な導入が可能です。
効率的な増分データ再計算用スマートデータ再構成エンジン。

何千ものモデルを作成し一番良いモデルを見つける

Dataiku AutoML を活用し、複数のアルゴリズムとパラメータの自動テストで、クラス最高モデルを素早く作成します。または独自のカスタムモデル作成や高度な深層学習モデルの使用など、すべてのトレーニング設定、アルゴリズム設定、および最適化プロセスを完全に管理可能です。

Dataiku は最もよく使われている機械学習エンジンを4つ—（Python、Spark、H2O、TensorFlow ）サポートします。また、32 種類以上のコアアルゴリズムがあります。

API で自動化・監視

Dataiku はプラットフォームのセットアップ、管理、また展開用の広範なAPIを提供します(完全なソリューションや新サービス導入の自動化を含む)。管理機能拡張により、既存の監視 IT スタック内に Dataiku を統合できます。

大規模な機械学習のための迅速な実験と運用可能化。

ストレージとコンピューティングに依存しない

あらゆる IDE や Git に対応

Spark & K8S Clusters: フルマネージド (大規模環境)

Dataiku プラグイン使ったパワフルなエクステンション

エンドツーエンドの堅牢なデータアーキテクチャを構築

何千ものモデルを作成し一番良いモデルを見つける

API で自動化・監視

技術専門家のためのDataiku

大規模な機械学習のための迅速な実験と運用可能化。

ストレージとコンピューティングに依存しない

あらゆる IDE や Git に対応

Spark & K8S Clusters: フルマネージド (大規模環境)

Dataiku プラグイン使ったパワフルなエクステンション

エンドツーエンドの堅 牢なデータアーキテクチャを構築

何千ものモデルを作成し一番良いモデルを見つける

API で自動化・監視

エンドツーエンドの堅牢なデータアーキテクチャを構築