でたぁっ 感動と失敗の備忘録

データ解析を担当することになったサラリーマンの備忘録

ブログデザインを変えてみた

 いい年になってはてブを始めたのはいいが、書き方などまだまだ分からないことだらけ。
コードなどを残しておきたいと思っていたのでデフォルトのデザインだと横幅がちと狭いぞ~。そこでグーグル先生にお尋ねし、はてブの先輩方を参考にしながらスタイルをカスタマイズすることにした。
 デザイン → カスタマイズ → 画面下の {}デザインCSS で変えればよいとのことだ。10数年前に在籍していたシステム開発部門で覚えといたスタイルシートが役に立った。(でも最近はさらに進化しているようであるが。。。) また、最近のブラウザ(私はCrhomeを使っている)は便利になったものだ。ページ表示後に要素なるものを見れる! これで変更箇所も結構早く見つけることが出来た。で、完成したのがこのスタイルです。
 cssはこんな感じにしました。ついでにスーパーpre記法というのも分かった。皆さんコードを書くときにはこれ使っていたのですね。

/* <system section="theme" selected="report"> */
@import "/css/theme/report/report.css";
/* </system> */

/* <system section="background" selected="fff"> */
body{background:#fff;}
/* </system> */

#container {
  width: 1000px;
 }
#content {
  padding-left:10px;
  padding-right:5px;
}
/*記事*/
#main {
  width: 680px;
 }
#wrapper {
  width: 680px;
float: left;
}
/*サイドバー*/
#box2 {
  width: 280px;
}

/*ブログタイトル*/
#title {
  display: inline-block;
  font-size: 40px;
}
#blog-title {
  padding: 40px 0 40px 0;
}
/*ブログの説明*/
#blog-description {
  display: block;
  -webkit-margin-before: 0.83em;
  -webkit-margin-start: 5px;
  -webkit-margin-end: 0px;
  -webkit-margin-before: 0.83em;
  -webkit-margin-after: 0.83em;
  -webkit-margin-start: 0px;
  -webkit-margin-end: 0px;
  font-size: 18px;
  font-weight: bold;
*/
}

/*ブログ日付*/
.date {
  font-size: 15px;
  font-weight: bold;
  padding-bottom: 5px;
  border-bottom: 2px solid #ff1493;
  margin-bottom: 10px;
}

/*タイトル*/
.entry-title {
  margin-bottom: 10px;
  line-height: 1.3;
}
.entry-title a {
  font-size: 24px;
  color: #222;
  text-decoration: none;
}

/*カテゴリータグ*/
.entry-header .categories a {
  font-size: 14px;
  padding: 2px 5px;
  text-decoration: none;
  background-color: #efefef;
  border-radius: 3px;
}


/*プロファイル*/
.hatena-module-title {
  font-size: 16px;
  font-weight: bold;
  margin-bottom: 5px;
}

/*ハイパーリンク*/
.entry-content a:visited {
  color: #0000cd;
}

TokyoR#30に参加してきた

 以前から参加してみたかったTokyoRに参加してきたので個人的な感想をメモメモ。φ(..)
ツートまとめはこちら 第30回R勉強会@東京 #TokyoR - Togetter @bob3bob3 さんがまとめてくれています。

1.はじめてのR(@aad34210さん)

demo()関数でdemoが見れる。ex)demo(graphics) + enter
R Cheet Sheet は、Rのカンニングペーパー
CRAN Task View はパッケージを見つけるのに便利

2.分散分析(@aad34210さん)

2つ以上の平均値を比較するための統計的手法(2つの場合はt検定)
主効果と交互作用効果
rep関数は繰り返せ
aov関数が分散分析
interactionm.plotで図示できる

3.MySQLではなくRでデータ操作しよう(@IT7Cさん)

Rデータ自由自在 ※そういえばこの本まだななめ読みだった もう1度読もう
DBI、RMySQL ※RMySQL は type='source' が必要

4.Rで始める強調フィルタリング(@mikado_hitoさん)

実際には組み合わせてつかうらしい
メモリベース
ユーザーベースTop-N は計算量が多い
アイテムベースTop-N はアイテムを選択しておくアクションが必要
モデルベース はベイジアン、クラスタリング、回帰モデル など
ハイブリッド型 はコンテンツベース
課題
 データのスパース性、スケーラリビティーシノニム、灰色の羊、シリングアタック
評価の枠組み
 k-given法による評価
 MAE 誤り率
 Precision 再生率
 Recall 再認率
 TPR 陽性率
 FPR 偽陽性率
 ROC曲線 ※判別器の指標
 Rでの実行例
 RecommenderLab ←これは使えそう! 実務で試すしかない!
 Jester5k サンプルデータセット 5000人分のジョーク

5.歴史を学んでR言語の未来を考える(@tech_machiiさん)

統計数理研究所のスパコンが更新される(アベノミクス効果)
RはAPLのパクリ
探索的データ解析では、まずデータを図で眺めるのを重視している
Rでも薬事申請できるようになった?

6.Rでコンジョイント分析(@bob3bob3さん)

重要度は全てたすと100になる
個人別の結果でクラスタリングもできる
DoE.base、AlgDesign 直交表
conjointパッケージ ポーランド語?
A/B多変量テストはコンジョイントと同じ考え?

7.plyrパッケージ徹底入門(@teramonagiさん)

作者は ggplot2 開発者
分割・適用・結合 が plyr の思想
Split、Apply、Combaine
XYply が最もよく使う関数 ※X:入力、Y:出力 のデータタイプ
従来のRの関数とも対応しているが使いやす
欠損値を除外 na=True
プログレスバーも導入可能
.parallel 引数もある ※並列処理
colwise関数 列毎への関数適用


以下LTをしてくれた皆様

8.R-3.0.0を使ってみてわかったn個のこと(@wdkzさん)

RDFは、主語・述語・目的語で構成
SPARQLは、RDFにアクセスするためのクエリ言語
Rでもできる

10.fluentdとR でお手軽ログ解析(@_TRIP_DANCERさん)

MongoDB

11..NET で書いて R で実行(@kos59125さん)

12.R 3.0.0 is released!(@sfchaosさん)

13.RとC++と画像処理 (PART3)(@yuukicammyさん)

ヒストグラムの類似性をEMDで求める
SIFT 画像特徴
Visual Words クラスタの中心ベクトル


皆様どうもありがとうございました。ペコリm(__)m
次回は6月1日、すでにATNDもたっている。さっそくエントリーさせて頂きました。

ブログをかこう

背景
 メーカーに入社して20年以上すぎた。入社からの10数年はシステム開発部門で生産・販売・物流・会計・人事のシステム開発を行っていた。当時はメインフレームのCOBOLとDBを使っていた。システム開発部門の最期のお仕事はマーケティング、広告宣伝と販売促進の開発する頃にはクライアントサーバー方式が採用されるようになり、UNIX、WindowsなどのサーバーとOracleSQL-ServerなどのRDBに変わってきていた。ユーザーインターフェースも専用端末からWindows3.1になりVBやHTML(ASPアプリ)を開発するようになった。
 現在はマーケティング部門に在籍し、POSや購買履歴データを中心に解析業務を行っている。早いものでもうすぐ10年。Rを知ったのは09年頃、先輩から教えて頂いたのがきっかけ。書籍、グーグル先生、そしてはてなブロガーさんを参考にしながら多変量解析を中心に使用してきた。最近はデータソースも広がり、購買実態、アンケート、ブログやTwitterなどの文章、さまざまなWEB Serviceで提供されているデータを取得する為にRubyも使うようになった。ビジュアライゼーションにはcytoscapeも使うようになった。変化が速すぎて記憶がどんどん消えていくのがもったいないと感じる今日この頃。コードを書いて結果が出た時の でたぁっ といった感動とか失敗を残しておこう。日記は小さい頃にかあちゃんから書かされた経験、自分で書いても3日坊主だったのでタイトルは備忘録にしとこう。

 まずは、まだ記憶が残っているところからRパッケージとRubyで書いたコードについて書いてみよう。
メーカー勤務ということもあり、OSはWindowsXP(又は7)といった環境です。

  • Rパッケージ

wordcloud ※中国語もチャレンジ(中国語まったくわかりませんが。。。)
googleVis
Shiny
RODBC、sqldf
ggplot2
など

amazon-aaws ※Amazon Product Advertising API
など

さて、はてな表記法にも慣れながら書いてみるか