Currently browsing

February 2014

可扩展的中小型推介系统实践

本文的目的是描述如何使用 Mahout 开发/部署一个可扩展的中小型推介系统

我会一步一步的描述如何用 Mahout 搭建一个这样的推介系统。本文假设读者对 Mahout 有所了解,熟悉 Mahout 中的协同过滤(Collaborative Filtering)推介算法。本文不会描述 CF 相关的具体算法。

场景描述

这是最近在做的一个推介系统的实际场景。垂直领域的视频播放网站,用户访问我们的网站观看视频,我们根据用户的观看记录向用户推介其可能感兴趣的视频。

  1. 视频数量:几千或几万
  2. 用户数量:几十万
  3. 用户每播放完一个视频后,在视频播放页面显示用户可能喜欢的其他视频
  4. 所有的播放请求中,20% 是登陆用户,80% 为未登陆的匿名用户(由于版权的原因,有些视频必须登陆付费之后才能观看,所以登陆用户的比例很高)

阅读全文 “可扩展的中小型推介系统实践” »

Ubuntu 安装备忘录

新年回来开工第一天就遇到电脑故障,使用有线网络上网的时候,丢包率达到 80%,严重影响到上网速度。最后弄啊弄居然把 Ubuntu 桌面给弄坏了。纠结的,既然无法启动了,那就使用杀手锏了:重装 ^_^
这里记录安装的整个过程,以后就不用到处 google 找教程了。

硬盘安装 Ubuntu
  1. 下载最新的 Ubuntu iso 镜像,放在一个空余的分区。(我用的是 NTFS 的分区,未试验是否可以使用 Ext4)
  2. 重启系统,进入 Grub2 引导界面,按 C 进入手动引导界面
  3. 输入下面的命令
    insmod loopback
    loopback loop (hd1,msdos5)/ubuntu.iso
    linux (loop)/casper/vmlinuz.efi boot=casper iso-scan/filename=/ubuntu.iso 
    initrd (loop)/casper/initrd.lz
    boot
  4. 引导 ISO 镜像之后,按照提示安装 Ubuntu

阅读全文 “Ubuntu 安装备忘录” »

一键快速配置 VIM

每次有新的服务器,或者换新的电脑的时候,配置 VIM 总是很麻烦。不管是一步一步的配置,还是拷贝原有的配置文件,都不是很便捷。有时候要拷贝配置文件的时候,还会发现找不到原来用的配置文件了。

在网上看到一个 Gist。本来挺好用的,但是这个 gist 链接坏掉了,无法打开。不过还好的是自己有个备份,所以稍微做了一下修改保存到自己的 Github repo 里:https://github.com/hellojinjie/vimrc

只要在 bash 里切换当前目录到主目录运行下面命令

curl https://raw.github.com/hellojinjie/vimrc/master/vim.sh | sh

就可以一键完成 VIM 的配置。

如果你对这个配置也感兴趣的话,欢迎 fork,并做适合自己的修改。