0%

下载.png

Docker 简介

Docker 是一个开源的引擎,可以轻松的为任何应用创建一个轻量级的、可移植的、自给自足的容器。开发者在笔记本上编译测试通过的容器可以批量地在生产环境中部署,包括 VMs(虚拟机)、 bare metal、OpenStack 集群和其他的基础应用平台。
Docker 通常用于如下场景:

  • web 应用的自动化打包和发布;
  • 自动化测试和持续集成、发布;
  • 在服务型环境中部署和调整数据库或其他的后台应用;
  • 从头编译或者扩展现有的 OpenShift 或 Cloud Foundry 平台来搭建自己的 PaaS 环境。
阅读全文 »

数值分析是研究科学计算中各种数学问题求解的数值计算方法。

pexels-photo-1627276.jpeg
最近谷歌研究人员通过新的 BERT 模型在 11 项 NLP 任务中夺得 STOA 结果,这在自然语言处理学界以及工业界都引起了不小的热议。作者通过在 33 亿文本的语料上训练语言模型,再分别在不同的下游任务上微调,这样的模型在不同的任务均得到了目前为止最好的结果,并且有一些结果相比此前的最佳成绩得到了幅度不小的提升。借此契机,我们回顾一下词表示方向的这两年的一些新进展,希望能发现一些规律和新的 idea。基本的介绍路线如下:

  • 从预训练说起,词向量其实就是 NLP 领域的迁移学习的起点
  • Word2Vec 有哪些缺点,为什么大家要去寻找新的方法
  • AlanNLP 提出的 ELMo
  • Transformer 的结构
  • FastAI 就推出的 ULMFiT
  • OpenAI 提出的 GPT
  • 谷歌出品的的 BERT
阅读全文 »

Next 配置文件

1
2
3
4
mathjax:
enable: True
per_page: false
cdn: //cdn.bootcss.com/mathjax/2.7.1/latest.js?config=TeX-AMS-MML_HTMLorMML

更换渲染引擎

更换 Hexo 的 markdown 渲染引擎,hexo-renderer-kramed 引擎是在默认的渲染引擎 hexo-renderer-marked 的基础上修改了一些 bug ,两者比较接近,也比较轻量级。

更改渲染设置

到博客根目录下,找到 node_modules\kramed\lib\rules\inline.js,把第 11 行的 escape 变量的值做相应的修改:

1
2
//em: /^\b_((?:__|[\s\S])+?)_\b|^\*((?:\*\*|[\s\S])+?)\*(?!\*)/,
em: /^\*((?:\*\*|[\s\S])+?)\*(?!\*)/,

同时把第20行的em变量也要做相应的修改。
1
2
//em: /^\b_((?:__|[\s\S])+?)_\b|^\*((?:\*\*|[\s\S])+?)\*(?!\*)/,
em: /^\*((?:\*\*|[\s\S])+?)\*(?!\*)/,

重新启动hexo(先clean再generate),问题完美解决。

阅读全文 »

前言

本篇主要讲 LSTM 的参数计算和 Keras TimeDistributed 层的使用。LSTM 的输入格式为:[Simples,Time Steps,Features]

  • Samples. One sequence is one sample. A batch is comprised of one or more samples.(就是有几条数据)
  • Time Steps. One time step is one point of observation in the sample.(时间步长,通常对应时间序列的长度)
  • Features. One feature is one observation at a time step.(一个时间步长对应的向量长度)

举个文本的例子,原始一个 batch_size=50, 一行文本的长度 max_len=10, 所以输入矩阵为 [50,10],embedding 成 300 维的向量后,格式为 [50,10,300],分别对应 Simples,Time Steps,Features。
另外一个需要设置的参数是 LSTM 的输出维度 (Output_dim),比如为 128,LSTM 的参数量计算为

阅读全文 »