https://postd.cc/optimizing-gradient-descent/

勾配降下法は、最適化のための最も知られたアルゴリズムの1つです。これまではニューラルネットワークを最適化するのに最も一般的な方法でした。このブログの投稿では、実際にアルゴリズムを実行する際の助けとなるよう、勾配降下法を最適化する異なったアルゴリズムの動作についての洞察をしてみたいと思います。(編注:2016/07/29、いただいたフィードバックをもとに記事を修正いたしました。) 目次: さまざまな...