プログラマーを頃す住所が見つかる [595582602]

1 ::2023/06/12(月) 11:17:14.81 ID:vsV33mHw0.net ?2BP(3745)
https://img.5ch.net/ico/anime_shii03.gif
 
例えば、長野県庁のある長野市南長野で、県庁のすぐ北東斜向かいは「県町」という町域です。これを素直に書くと「長野県長野市南長野県町」となり、「長野県」が二回も登場します。

安易に都道府県名を取り除く処理を書くとこれが「長野県長野市南長野県町477-1」→「長野市南町477-1」になってしまったりするわけです。恐ろしいですね。
 
 

しなの鉄道で回送電車が脱線 けが人なし、長野・上田
デイリースポーツ|18 minutes ago
https://www.daily.co.jp/society/national/2023/06/12/0016463683.shtml

133 ::2023/06/12(月) 15:47:29.42 ID:Vf5tHjC20.net

>>132
正式住所だと同じ住所に複数建屋があって建物名の表記が統一されてなかったりとか

139 ::2023/06/12(月) 16:20:41.58 ID:flqK3LlX0.net

神奈川県町田市なんて優しいな

117 ::2023/06/12(月) 15:04:11.87 ID:exwlbyCW0.net

郵便番号て便利なものあるんだからそれ使えよ
数字だけで管理できるやん

150 ::2023/06/12(月) 17:24:33.00 ID:eTb8Bnfe0.net

PG頃すにゃ刃物はいらぬ 住所のひとつもあればいい

106 ::2023/06/12(月) 14:42:02.25 ID:VF76qBZT0.net

>>51
とりあえずこの長野市のケース限って言えば、
大字「南長野」の中の「県町」なので、
「長野県町」が住所の先頭に来ることはあり得ないよ

222 :シリウス(千葉県) [ZA]:2023/06/14(水) 14:07:39.40 ID:+7O6pAFq0.net

>>187
探索範囲の文字列をなるべく短くしておいてからマッチさせるんやで。

165 ::2023/06/12(月) 19:05:51.35 ID:Nvn6CSso0.net

郵便番号拡張して番号だけでいけるようにしようぜ
書くのも楽だしな

14 ::2023/06/12(月) 11:25:35.10 ID:TElnpMwn0.net

都道府県を取り除くのにgオプション付けるバカはいない

131 ::2023/06/12(月) 15:44:42.27 ID:NwKZ0nSQ0.net

>>77
みんな大好きデジタル庁がやってくれてるぞ

https://www.digital.go.jp/policies/base_registry_address/

16 ::2023/06/12(月) 11:28:01.44 ID:gBClSM5c0.net

現場猫にチェックさせろ

192 ::2023/06/13(火) 07:32:48.11 ID:qrBT6UVH0.net

>>7
志布志支所は本所になりました

2 :プランク定数(茸) [ニダ]:2023/06/12(月) 11:18:50.59 ID:+EB9H+Gv0.net

これがぬるぽ?

104 ::2023/06/12(月) 14:26:22.10 ID:At0Ut30H0.net

少なくともこの程度なら先頭からの最短一致とかですらどうとでもなるだろ

58 ::2023/06/12(月) 12:08:46.61 ID:VT/KBEtZ0.net

市区町村の下に47都道府県名が入る地区はどれくらいあるんだ

18 ::2023/06/12(月) 11:28:11.99 ID:cRGauAIK0.net

単純に左から順番に処理すればいいだけじゃないの

135 ::2023/06/12(月) 16:03:03.64 ID:mS3/+0y+0.net

>>134
変なアンカー入っちゃったすまん

×「長野市南>>44」でもなく
○「長野市南長野県町」でもなく

22 ::2023/06/12(月) 11:35:49.39 ID:0NoRCyBT0.net

>>21
マッチした文字を47都道府県と照合するから不具合にはならんよ

183 ::2023/06/13(火) 00:10:44.89 ID:VoSgIUxe0.net

>>12
登米市:とめし
登米町:(登米郡とめぐん)とよままち

関東人は大和インターを(たいわいんたー)と読む方が難しいと思われ

67 ::2023/06/12(月) 12:28:11.77 ID:ZANnWmvL0.net

>>3
鹿児島県志布志市志布志町

176 ::2023/06/12(月) 22:08:56.01 ID:2cA7Cppq0.net

群馬なのに長野原

105 ::2023/06/12(月) 14:38:54.48 ID:kf4iosTd0.net

数個だけ存在する都道府県をまたがるイカれた郵便番号とかと比べたらこんなもん全然マシだな

162 ::2023/06/12(月) 18:23:54.78 ID:sTs/ami60.net

>>7
よくこれが例に上がるけど、
コンピューター的には区切りがしっかりしてるから
むしろ健全なデータだぞ

187 ::2023/06/13(火) 05:00:47.54 ID:/Wom/hpj0.net

>>13
正規表現って重いから使いたくなくね

13 ::2023/06/12(月) 11:25:19.14 ID:YLiMPcsB0.net

そんなアホなプログラマーいねぇよw
正規表現で頭から一番目に出てきた件の左側を県と認識させる

10 ::2023/06/12(月) 11:23:36.13 ID:YTozCfaA0.net

>>6
ほんこれ

182 ::2023/06/12(月) 23:58:30.80 ID:mb4fFgR90.net

>>7
早口言葉w

184 ::2023/06/13(火) 01:01:26.89 ID:4drJo9am0.net

こういうのをWebAPI経由で正規化してくれるような誰もが共通に使えるサービスを提供するのがデジタル庁のやるべき仕事なんじゃないの

211 :カペラ(茸) [FR]:2023/06/14(水) 01:18:58.86 ID:jTHp+jX30.net

数字割当されてる名称がなんだろうと関係ない

154 ::2023/06/12(月) 17:40:24.87 ID:NwKZ0nSQ0.net

>>148
とりあえずデジタル庁の公開してるデータ使うのが
いまのところ一番早くて確実だと思う

42 ::2023/06/12(月) 11:48:55.45 ID:n/EbOdF00.net

ていうか住民票と運転免許証の住所表記統一しろよ💢
住民票は1丁目2番地3号が運転免許証だと1-2-3とか

11 ::2023/06/12(月) 11:23:36.34 ID:gDsgL9Yj0.net

>>6
うーん、アスペルガー

51 ::2023/06/12(月) 11:58:15.71 ID:h5crzRm60.net

>>48
手入力で長野県町を文頭にされたらバグるって話だろ

198 ::2023/06/13(火) 10:01:43.86 ID:YPaod+nt0.net

つうか、市町村役場にデータ入力をチマチマ業務の傍ら何年も掛けて移行させたりすれば良かったのにな
急ぎ過ぎなんだよ

129 ::2023/06/12(月) 15:38:53.14 ID:pp3w+yVP0.net

どっかのdbやtbl引っ張ってるから問題ない

40 ::2023/06/12(月) 11:48:09.43 ID:vsV33mHw0.net

県市町村以下それぞれ個別で枠作って入力させればいいんじゃねえの

93 ::2023/06/12(月) 13:58:53.31 ID:QiJF9PZ90.net

岐阜県岐阜市県町
栃木県足利市県町
長野県長野市県町

ぐぐると県町とかもあるのな

202 ::2023/06/13(火) 10:29:02.28 ID:7zHFmUck0.net

住所は全部コード化しちまえよ
郵便番号の桁を増やして
123-4567-8901
みたいでどうよ
マンションはさらに部屋番号追加で
123-4567-8901-301
とか

65 ::2023/06/12(月) 12:15:55.83 ID:L3o1gtWv0.net

何が恐ろしいのか

215 :アンドロメダ銀河(茸) [ニダ]:2023/06/14(水) 01:39:53.49 ID:chgFcPJr0.net

>>214
人間に入力させると郵便番号誤り頻発するのがな…
手書きを読み取るなら読み取り誤りも発生する
入力データが「正確な郵便番号と住所、市区町村統合前の古いものも一切ない」みたいなシチュエーションの方がレアかもしれない

209 :冥王星(東京都) [US]:2023/06/14(水) 01:14:53.12 ID:kN8FmYqM0.net

安易に実装するにしても都道府県は行頭に制限するだろ常識的に考えて

141 ::2023/06/12(月) 16:28:32.53 ID:tHKiWbES0.net

好き勝手書くからね自由記述だと

入力規則を決めて入力規則以外の入力を排除するしかない
最近の郵便番号を入れたら自動的に町名まで表示される仕組みの入力以外は認めないのが一番早いか

219 :クェーサー(東京都) [US]:2023/06/14(水) 09:26:47.06 ID:Nbaffs2Q0.net

>>213
だからデジタル庁がやってるって
https://www.digital.go.jp/policies/base_registry_address/

21 ::2023/06/12(月) 11:33:38.55 ID:BKcLN1qT0.net

>>6
それだと県を省略して入力する人がいると不具合になる。

218 :タイタン(茸) [ニダ]:2023/06/14(水) 02:24:40.93 ID:4EIr16uj0.net

>>217
横だけど何がいいたいかわかんね
日本語苦手か?

103 ::2023/06/12(月) 14:24:17.95 ID:TElnpMwn0.net

>>101
AIってのは既知データの学習により未知データに対応できるのが肝であって
単なるDB検索はAIとは言わない

>>102
このスレで何度も書かれている通り>>1の課題なら小学生プログラマでも対応可能だよ

199 ::2023/06/13(火) 10:06:09.63 ID:JgoSVYt+0.net

>>198
うん自治体側で実装させず国が一つシステム作ればよかったと思う
浮いた工数(コスト)で自治体や健保が入力補助や修正してイレギュラーは運用でカバー

ワクチン接種の予約システムなんかも自治体ごとに作らせてて、共通システム使ってるところはあったものの何だかな

193 ::2023/06/13(火) 07:42:33.56 ID:p9F0lA070.net

京都市「」

70 ::2023/06/12(月) 12:31:53.98 ID:A5Zb+UwM0.net

前方一致を知らないやつがいるとでも?

110 ::2023/06/12(月) 14:49:36.87 ID:XLfApNQ20.net

>>106
誤った住所だろうが、それを頭に書く人がゼロではない可能性もあるからなぁ…
変な省略したり、そもそも存在しない住所書いてくるのはよくある

221 :アンタレス(三重県) [PE]:2023/06/14(水) 14:03:31.14 ID:L0rHzEvo0.net

郵便番号データベースからひっぱってくるので

122 ::2023/06/12(月) 15:13:00.13 ID:IG1SaQ1j0.net

京都といい、北海道といい、特殊な住所の対応なんて国土院のDBとjoinして置換したらいいじゃん

日本の地名の正規化なんてDB使うべきだし、クローズドなシステムであれば最悪オンコードで書くのがベター。

173 ::2023/06/12(月) 21:36:08.56 ID:+n4XpDsd0.net

いや都道府県までは当然余裕だが問題はそれ以降なんだよなあ

173 ::2023/06/12(月) 21:36:08.56 ID:+n4XpDsd0.net

いや都道府県までは当然余裕だが問題はそれ以降なんだよなあ

32 ::2023/06/12(月) 11:41:44.93 ID:P5PiFc6j0.net

>>8
マジ?w

201 ::2023/06/13(火) 10:20:36.71 ID:HTyjAuCy0.net

不治痛にやらせたのが間違い?

95 ::2023/06/12(月) 14:02:53.75 ID:tHKiWbES0.net

アマゾンなら本気出したら住所照合AIを作れるだろうな

配達業者に配達させるたびに
出荷伝票上の宛先と住所を比較させて
教師データにする
毎日1億件くらいデータ入れるわけでしょ
直ぐに完璧なAIができそう

69 ::2023/06/12(月) 12:29:54.42 ID:8V9bXzOT0.net

俺イレギュラー処理得意よ
on error goto仕込んでやるから現場ネコレベル

62 ::2023/06/12(月) 12:11:39.75 ID:jHsfAahk0.net

>>55
>>56
このタイプは5ヶ所あったはず

5 ::2023/06/12(月) 11:20:36.47 ID:cXGcHT3B0.net

あがたまち

138 ::2023/06/12(月) 16:13:20.58 ID:7pK71kAb0.net

仕事で似たようなことあったよ
郡って地名があってね

171 ::2023/06/12(月) 21:02:08.47 ID:qUnx3fPu0.net

>>167
既にあるぞ

145 ::2023/06/12(月) 16:41:08.24 ID:zBrHz0SE0.net

>>140
例外が多すぎて困ってるんでしょ

99 ::2023/06/12(月) 14:16:23.64 ID:tHKiWbES0.net

>>97
問題がなにかも分かってないのかよ

同じ住所でも複数のパターンの文字列で記述されて揺れがあるから誤記なのか省略なのか判らない現状があるからね

196 ::2023/06/13(火) 09:46:59.83 ID:YPaod+nt0.net

各市町村の住民票はどうやって申請時にデータ取り出してるんだろ?
それを体系化すれば良いだけちゃうのか?

結局現場のヒアリングを一切しないで机上だけで設計するからこんな事でトラブル起こすんだろ?

101 ::2023/06/12(月) 14:20:33.45 ID:tHKiWbES0.net

宛先って誤記や揺れがあるからね

地域担当のベテラン郵便局員や配達業者は経験を元に頭の中にある住所DBと比較して最も近いものはここだろうと推測判断して配達してるわけよ

これをAIにやらせればいいだけ

217 :レグルス(やわらか銀行) [US]:2023/06/14(水) 02:04:02.49 ID:Y9Vwy3NI0.net

低脳ウェブ屋ホイホイになってるが
ウェブ屋はプログラマーじゃねえ

逆引きが存在しない>>134
これが低脳ウェブ屋のいじるプログラミング言語だから

126 ::2023/06/12(月) 15:16:36.55 ID:Qe/fCrdo0.net

表記の揺れはしんどいよな
チェックでイライラする

39 ::2023/06/12(月) 11:47:19.54 ID:aRQJ8K0C0.net

小役人どもは今まで何十年も何のため各種申請書類の住所欄に
「ふりがな」を振らせてたんだよw

223 :クェーサー(東京都) [US]:2023/06/14(水) 15:37:30.27 ID:Nbaffs2Q0.net

>>221
郵便番号データベースだと逆引きでマッチしないパターンがある

188 ::2023/06/13(火) 05:05:58.70 ID:Cvtl63B+0.net

>>184
郵便局APIで

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください




RSS


%d