2009年6月29日月曜日

知識マネジメント⇔ナレッジマネジメント⇔データベース

今まで紹介されてきた知識マネジメント的な目新しいサービスというよりも、今回は企業等で使われている商品情報データベースやナレッジマネジメントサービスの潮流を中心にした、別の角度からの事例紹介をします。
データを記録するものをこのように分類をして、各々の相関関係や類似性・特徴などを考えて行きます。
これらの中でも、今回はデータベースが話の中心です。

データベースには一般に知られ使われているものとしてリレーショナルデータベース、即ち、ACCESSやSQLserver、Oracleなどと、それ程知られていないけれどMAC系のソフトウェアだった、ファイルメーカーのようなカード型データベースがあります。
(*最近稀に企業でも部分的にファイルメーカーを導入している事例をみるようになりました。)

このなかのeBASEはACCESS及びSQLserverをカード型データベースのように運用させたソフトウェアです。
データベースの構造的な側面から比較してみます。

RDB以外は、実はよく似ていています。
それはデータベースの正規化が不要なので、データベース項目の追加が可能である点です。

RDBではデータベースの正規化をしなければなりませんが、一度正規化を経て構築されたデータベースに項目を追加することはできません。項目を追加する場合には、もう一度初めからデータベースを構築し直して、データを移行せねばならず、大きな作業負荷がかかります。
しかし、最近は社会的環境、経済的環境、法律的環境の変化が早く、すぐに項目追加の必要がでてきます。
例えば、エコロジーに関する法律が施行されたり、取引先からエコロジーに関する項目の提供を新たに求められるようになるなど、様々です。
ですから商品情報データベースなどでは、伝統的なRDBは使いにくくなっています。
eBASEは、RDBのデータベース項目を「項目名」と「値」と定義しているだけなので、自由に項目を追加できます。実質的なデータは縦に長い1つのテーブルに収められることになります。
(ひたすら縦に長く書き連ねるだけでは、検索速度が遅くなるのですが、それを回避する構造は別途持っています。)
このように1枚のテキストファイルに<項目名>値と縦にデータを書き連ねるXMLとデータベースのテーブルに縦に長く書き連ねるeBASEは非常によく似た構造だと言えます。
情報を管理するDBとしては、テキスト以外のデータ、画像、動画、音声、Officeなど様々なアプリケーションで作られたファイル、などもDBに格納し管理する必要があります。
・これらのファイルをDBの外のフォルダで管理する方がDB自身のファイルサイズは小さくて済みます。
またDBの項目は用途に応じて、必要な項目を、用途に応じて理解しやすいレイアウトで表示する方が合理的です。
次にデータの入力について考えます。
多くの商品情報DBは構築運用に失敗します。
(1)社外(仕入先)などから帳票(手書き、EXCEL)などで貰った商品情報を、社内の担当者がDBに入力する場合。
・入力ミス、入力のタイムラグが発生する。
・入力負荷やコストパフォーマンスから、取引会計上最低限の情報(価格、仕入値等)、物流上最低限の情報(サイズ、重量等)までが入力運用できる限度なので情報量が少ない。
(2)社内のDB構築担当部門が入力する。
・単純作業なので、入力担当者のモチベーションが上がらない。
・商品情報が確定し、入力可能になる頃には、商談等の活用の場は殆ど終了していて、情報として役に立たない。
   ↓
タイミングが遅れた、最低限の情報しかないので、誰も閲覧しなくなる。
誰も閲覧しないから、入力も疎かになる。
だから外部による情報登録が有効になります。
仕入先から帳票ではなく、直接商品情報の登録データを貰う。
印刷会社がカタログやパンフレット制作用に作成したデジタルデータを貰う。
などの方法です。
この時に、データ登録はWEBブラウザの入力画面を通じた登録が良く考えられますが、これは実際の運用上難しい面が実はあります。

WEB画面での入力では、まず回線の問題があります。まだまだ地方の取引先ではISDNなどの回線しか使えない地域があり、このように回線が細いと、画面表示が遅い、データ登録処理が遅いなどの問題が発生します。
また実際の業務上では来客などで登録業務を中断させられた時に保存を忘れると、経時でセッションアウトし、登録データを失うことがあります、(このBloggerは自動保存機能が強力でいささか驚いていますが、稀な対応です。)
また登録データは入力者側(C社)ではなく、登録先(A社やB社)にあるので、登録データの閲覧の不自由さと、登録先が複数(A社とB社など)あると、何度も類似のデータを登録しなおす必要があります。

入力者側(D社)のローカルでデータを登録して、そのデータを複数の登録先に振り分けて送信する形にすると、入力は一度で、複数の登録先の登録ができ、入力者側にもデータが残ります。
送信もHTTPなどでバッチで送るので、回線の太さの影響もありません。

このようにして構築されたDBに以下のような例があります。



<補遺> 
1. HyperCard
・http://www011.upp.so-net.ne.jp/PARK/
・http://ja.wikipedia.org/wiki/HyperCard
2.ファイルメーカー
・http://www.filemaker.co.jp/
3.Gamedios
・http://www.gamedios.com/
4.eBASE
・http://www.ebase.co.jp/
5.LotusNotes
・http://www-06.ibm.com/software/jp/lotus/
・http://e-words.jp/w/Lotus20Notes.html
6.サイボウズ
・http://cybozu.co.jp/

2009年6月16日火曜日

VGI(Volunteered Geographic Information)の可視化に関する研究事例

Web上でユーザ参加型のサービスが増えている中で、VGI(Volunteered Geographic Information:ユーザ提供型地理情報)に関するコンテンツも増えてきている。またその可視化に関する研究も活発に行われるようになってきた。

以下の論文では、英国とアイルランドに関する地理情報付き写真を集めている Geograph British Isles( http://www.geograph.org.uk/ )などを対象として、そこでの地理情報やタグの可視化研究に取り組んでいる例である。

Geograph British Islesの画面1

Geograph British Islesの画面2

J. Dykes, R. Purves, A. Edwardes, and J. Wood, Exploring Volunteered Geographic Information to Describe Place: Visualization of the 'Geograph British Isles' Collection, Proceedings of GIS Research UK: (Manchester, UK), 2008, pp. 256-267.

http://www.unigis.org/gisruk_2008/proceedings/dykes_purves_edwardes_wood.pdf

vizoo

私は今まだ利用している日本のサイトはありませんが、授業をきっかけに、いろいろなサイトを探しに興味が出てサービスを発見した。

http://www.visualzoo.com/

Web上でいろいろな企業のデータを1つのグラフで重ねって自分の好きなグラフを書く事ができる。

FILLMORE ADVISORYが新たにサービスするvizooはWeb上でデータを検索し、検索したデータを別々に作業する必要なく、すぐにグラフに適用してグラフを作成し、共有するサービスだ。

vizoo は、企業の財務諸表と株価、経済指標などのデータを簡単に検索して分析し、分析されたデータをFlashのGraphic contentsと してYouTubeようにWeb上で直接作成して共有することができ、また、ブログやサイトに簡単に付けることができ、グラフは、データと連動され、デー タが変更する時グラフも一緒に変更する。

個人は無料で利用でき、企業向けに提供される有料サービスvizoo Proは7月から提供する予定で、企業のデータ分析と知識の共有ツールとして活用されると期待する。

より多くの統計データを基に、この形式のサービスが提供すれば、統計データへのアクセスが高まって簡単に必要なグラフを作成することができるのである。

2009年6月14日日曜日

タイムライン&地理情報マッピングサービス: Dipity



Dipity は、RSS Feed や XML データを読み込み、タイムラインを作成するサービスである(作成できるタイムライン数によって、無料と有料に分かれる)。

 Dipity
 http://www.dipity.com/

たとえば、Flickrや YouTubeなどに作成した自分のページのURLを入力することで、自分の投稿履歴をもとしたタイムラインを作成することができる。

さらに、Simile Timeline XML 形式のデータを Web上に置き、それを読み込ませることで、年表と地図を組み合わせたコンテンツを作成することができる。

Simile Timeline XML形式:

 <data>
  <event start="年月日" end="年月日" title="タイトル"
    image="画像URL" link="">Location:地名
  </event>
  …
 </data>



例として、Simile Project のデータを参考に、以下のようなXMLを作成する。


 <data>
  <event start="1732 Feb 22" end="1799 Dec 14"
   title="George Washington"
   image="http://upload.wikimedia.org/.../100px-Portrait_of_George_Washington.jpeg"
   link="">
   Location:Westmoreland County, Virginia, USA
  </event>
  <event start="1735 Oct 30" end="1826 Jul 04"
   title="John Adams"
   image="http://upload.wikimedia.org/.../Johnadamsvp.flipped.jpg"
   link="">
   Location:Braintree, Massachusetts, USA
  </event>
  ...
 </data>



これを Dipity に読み込ませることで、以下のタイムラインが生成される。

 http://www.dipity.com/timeline/President



上のXML データには地名も含まれているため、以下のような地理情報に基づく可視化も容易に行うことができる。

 http://www.dipity.com/timeline/President/map

タイムライン作成サービス: @nifty TimeLine

Web上で 自分用のタイムライン(年表形式のコンテンツ)を作成するサービスが増えている。

@nifty TimeLine は、タイムラインをもとにした参加型情報サイト(無料)である。現在、「自分史」のような個人的なものから、「日本史・合戦タイムライン」など、多くの人にとって関心があるテーマで様々なタイムラインが作成されている。わかりやすいユーザインタフェースが提供されているのが特長で、オンラインコミュニティとして成長しつつある。

 @nifty TimeLine
 http://timeline.nifty.com/

 日本史・合戦タイムライン
 http://timeline.nifty.com/portal/show/1499



以下は、ホノルル美術館のコレクションから、時間情報を取り出し、タイムラインにマッピングした例である。

 ホノルル美術館コレクション・タイムライン
 http://timeline.nifty.com/portal/show/8790



@nifty Timeline で作成したコンテンツは、タイムラインの左下に表示される「貼り付けタグ」に書かれたHTMLコードをコピー&ペーストすることで、ブログやWebページに簡単に組み込むことができる。上の2つのタイムラインは、その方法を用いてこのブログに組み込んでいる。

検索語分析ツール by Google

Google は、Web検索情報を元にした可視化ツールを公開している。

「Google Trends」は、検索トラフィックを、時系列、国・地域、都市、言語別に表示する。

 Google Trends
 http://www.google.co.jp/trends/



以下のように、URLの後ろに語を追加した検索も可能。

 http://www.google.co.jp/trends?q=Kyoto

「Google Trends」を拡張させた「Google Insights for Search」では、語句の検索動向を、より視覚的に表示する。

 Google Insights for Search (beta)
 http://www.google.com/insights/search/



例えば、Tokyo と Kyoto という語句で検索すると、それぞれの都市名に対する関心や検索動向の違いが推測できる。

 「Tokyo」の検索例
 http://www.google.com/insights/search/#q=Tokyo&cmpt=q
 →関心度の高い国・地域は、Japan、Singapore、Hong Kong、Indonesia、Malaysia の順。

 「Kyoto」の検索例
 http://www.google.com/insights/search/#q=Tokyo&cmpt=q
 →関心度の高い国・地域は、Singapore、Hong Kong、Japan、Austoralia、Canadaの順。

日本語でも検索できる。例えば「ナレッジマネジメント」、「知識」などを検索すると、以下のような結果になる。

 「ナレッジマネジメント」を検索 →当然ながら、日本のRegional interestが高い。

 「知識」を検索 →漢字なので、台湾のRegional interestが高いこともわかる。