Talking New York --- New Yorkで見つけた英語

発見と感動を与えてくれるニューヨークを英語学習に役立つコンテンツにして毎日お届けしています。

どの様にしてランキングを決定したのか?その手法を説明。

ランキングを作成するには、様々な手法があります。テレビやネットの広告では、「第一位!」といっても、何位中の第一位なのか、どのような調査をしたのかはほとんど語られることはありません。


「第一位!」と聞いただけで「すごいな!」と思ってしまいますが、よく調べてみると、カテゴリーや調査方法が違えば一位でなくなってしまうことがよくあります。


そこで、今回の「最も行きたいと思えるような都市ランキング」に"interesting"という単語が入っていることに着目しました。"interesting"は、かなり個人の感想である印象が強い言葉です。それをどのようにウィキペディアを活用してランキングとして作成したのか、ということです。


今回読んだ記事には、そのメソドロジー(methodology)が書いてありました。
ロングマンによると、“methodology”の意味は次のようなものです。


methodology
the set of methods and principles that you use when studying a particular subject or doing a particular kind of work
特定の主題を研究したり、特定の種類の仕事をしたりするときに使用する一連の方法と原則


このランキングを作るにあたって、次のようなメソドロジーを用いたそうです。
"location"という単語は、実際には「市町村」を意味すると思いましたが、記事の意図を考えて、「場所」としました。


Methodology:

1. Firstly the primary locations which are stored on Wikipedia articles were extracted. (A primary location is one where the uploader has specified that it is the true location of the main feature of the article.) This created a data set of 1.2 million locations.


  まず、ウィキペディアの記事に保存されている主要な場所を抽出した。(主要な場所とは、アップロード側⦅ここでは記事の著者⦆が、その場所が⦅ウィキペディアの⦆記事の主要な対象の実在する場所として指定したものである。)これにより、120万の場所のデータセットが作成された。



2. All locations where the latitude was less than -60 or more than 80 were removed.


緯度が南緯60度以上または北緯80度以上の地点はすべて削除した。



3. The locations were then reverse geocoded to reveal the country and closest city of each location.


その後、各都市の国名と最寄りの都市を明らかにするために、場所を逆ジオコーディング(緯度と経度の設定を)した。


4. The locations were then given an “Interest Weighting Score” (IWS) to reduce the bias caused by Wikipedia being a primarily English-based online encyclopaedia, with ties to the USA.


次に、ウィキペディアが主に英語をベースとしたオンライン百科事典であり、アメリカとの結びつきがあることに起因するバイアスを軽減するために、それぞれの場所に「インタレスト・ウェイト・スコア」(IWS)を与えた。


 This IWS considered the internet access of each country, how widely spoken English is in the country, and the activity on each country’s Wikipedia page, with additional diminishments applied to the USA, Canada, UK, and Australia.


このIWSは、各国のインターネットアクセス、その国でどれだけ英語が広く話されているか、各国のウィキペディアページの活動状況を考慮し、アメリカ、カナダ、イギリス、オーストラリアにはさらに減点が加えられた。


5. Heatmaps were generated using weighted results with Plotly Express and Python.


ヒートマップ(関心度の分布地図)が、Plotly ExpressとPythonを使用して重み付けされた結果を使用して作成された。


ここでのヒートマップは次のようなものです。(マップはこちらからのものです)


Heatmap of the world’s most interesting places, according to Wikipedia
ウィキペディアによる、世界中で最も行きたいと思う場所マップ



皆さんのお考えと比べていかがでしたでしょうか?


都市ランキングは様々な視点から全く違う結果になります。
また、いつか違った都市ランキングをご紹介できると思います。


Englishラボ
MisTy

×

非ログインユーザーとして返信する