Linear referencing events in PostGIS

psql -U spatial_user -h 127.0.0.1 mydatabase

mydatabase=>

-- Connect to the database
\c mydatabase

-- Check what tables exist in myschema
\dt myschema.*

-- Look at the structure of the observations table
\d myschema.obs

-- Look at the structure of the tracks table
\d myschema.tracks

-- Count records in each table
SELECT COUNT(*) as num_observations FROM myschema.obs;
SELECT COUNT(*) as num_tracks FROM myschema.tracks;

-- Check the coordinate system (SRID) being used
SELECT ST_SRID(geom) as srid FROM myschema.obs LIMIT 1;
SELECT ST_SRID(geom) as srid FROM myschema.tracks LIMIT 1;

-- Get basic statistics about track lengths
SELECT
    COUNT(*) as num_tracks,
    ROUND(AVG(ST_Length(geom))::numeric, 2) as avg_length_meters,
    ROUND(MIN(ST_Length(geom))::numeric, 2) as min_length_meters,
    ROUND(MAX(ST_Length(geom))::numeric, 2) as max_length_meters,
    ROUND(SUM(ST_Length(geom))::numeric, 2) as total_length_meters
FROM myschema.tracks;

num_tracks | avg_length_meters | min_length_meters | max_length_meters | total_length_meters
------------+-------------------+-------------------+-------------------+---------------------
        147 |             89.83 |              1.70 |            782.59 |            13205.13

-- Find the nearest track for each observation
-- This uses ST_DWithin to pre-filter to reasonable candidates (within 200m)
-- Then ST_Distance to calculate exact distances
SELECT
    obs.id as obs_id,
    tracks.id as track_id,
    ROUND(ST_Distance(obs.geom, tracks.geom)::numeric, 2) as distance_meters
FROM myschema.obs
CROSS JOIN LATERAL (
    SELECT id, geom
    FROM myschema.tracks
    WHERE ST_DWithin(obs.geom, tracks.geom, 200)  -- Only consider tracks within 200m
    ORDER BY obs.geom <-> tracks.geom  -- Use distance operator for quick sorting
    LIMIT 1
) tracks
ORDER BY obs.id;

obs_id | track_id | distance_meters
--------+----------+-----------------
      1 |      164 |           52.98
      2 |       66 |           40.05
      3 |       19 |           30.24

-- Calculate measures for each observation
WITH nearest_tracks AS (
    SELECT
        obs.id as obs_id,
        obs.geom as obs_geom,
        tracks.id as track_id,
        tracks.geom as track_geom,
        ST_Length(tracks.geom) as track_length_meters,
        ST_Distance(obs.geom, tracks.geom) as distance_to_track
    FROM myschema.obs
    CROSS JOIN LATERAL (
        SELECT id, geom
        FROM myschema.tracks
        WHERE ST_DWithin(obs.geom, tracks.geom, 200)
        ORDER BY obs.geom <-> tracks.geom
        LIMIT 1
    ) tracks
)
SELECT
    obs_id,
    track_id,
    ROUND(track_length_meters::numeric, 2) as track_length_m,
    ROUND(distance_to_track::numeric, 2) as dist_to_track_m,
    -- Calculate the measure (fraction from 0 to 1)
    ROUND(ST_LineLocatePoint(track_geom, obs_geom)::numeric, 4) as measure_fraction,
    -- Calculate the measure in meters
    ROUND((ST_LineLocatePoint(track_geom, obs_geom) * track_length_meters)::numeric, 2) as measure_meters
FROM nearest_tracks
ORDER BY track_id, measure_fraction;

obs_id | track_id | track_length_m | dist_to_track_m | measure_fraction | measure_meters
--------+----------+----------------+-----------------+------------------+----------------
      3 |       19 |         727.00 |           30.24 |           0.0377 |          27.42
      2 |       66 |         306.08 |           40.05 |           0.2049 |          62.71
      1 |      164 |         217.92 |           52.98 |           0.1313 |          28.62

-- Create a table of event points snapped to tracks
DROP TABLE IF EXISTS myschema.event_points;

CREATE TABLE myschema.event_points AS
WITH nearest_tracks AS (
    SELECT
        obs.id as obs_id,
        obs.geom as obs_geom,
        tracks.id as track_id,
        tracks.geom as track_geom,
        ST_Length(tracks.geom) as track_length,
        ST_Distance(obs.geom, tracks.geom) as distance_to_track
    FROM myschema.obs
    CROSS JOIN LATERAL (
        SELECT id, geom
        FROM myschema.tracks
        WHERE ST_DWithin(obs.geom, tracks.geom, 200)
        ORDER BY obs.geom <-> tracks.geom
        LIMIT 1
    ) tracks
),
calculated_measures AS (
    SELECT
        obs_id,
        track_id,
        track_geom,
        track_length,
        distance_to_track,
        ST_LineLocatePoint(track_geom, obs_geom) as measure,
        ST_LineLocatePoint(track_geom, obs_geom) * track_length as measure_meters
    FROM nearest_tracks
)
SELECT
    -- Create the snapped point using ST_LineInterpolatePoint
    ST_LineInterpolatePoint(track_geom, measure) as geom,
    obs_id,
    track_id,
    ROUND(measure::numeric, 4) as measure,
    ROUND(measure_meters::numeric, 2) as measure_meters,
    ROUND(track_length::numeric, 2) as track_length_meters,
    ROUND(distance_to_track::numeric, 2) as original_gps_error_meters
FROM calculated_measures;

-- Add a primary key
ALTER TABLE myschema.event_points ADD PRIMARY KEY (obs_id);

-- Create a spatial index for better performance
CREATE INDEX event_points_geom_idx ON myschema.event_points USING GIST (geom);

-- View the results
SELECT * FROM myschema.event_points ORDER BY track_id, measure;

obs_id | track_id | measure | measure_meters | track_length_meters | original_gps_error_meters
--------+----------+---------+----------------+---------------------+---------------------------
      3 |       19 |  0.0377 |          27.42 |              727.00 |                     30.24
      2 |       66 |  0.2049 |          62.71 |              306.08 |                     40.05
      1 |      164 |  0.1313 |          28.62 |              217.92 |                     52.98

-- Create linear segments from event points
-- Using a fixed 10-meter segment for demonstration
DROP TABLE IF EXISTS myschema.track_segments;

CREATE TABLE myschema.track_segments AS
WITH event_measures AS (
    SELECT
        ep.obs_id,
        ep.track_id,
        ep.measure,
        ep.measure_meters,
        ep.track_length_meters,
        t.geom as track_geom,
        10.0 as affected_size_meters  -- Fixed 10m segment for demo
    FROM myschema.event_points ep
    JOIN myschema.tracks t ON ep.track_id = t.id
),
segment_measures AS (
    SELECT
        obs_id,
        track_id,
        track_geom,
        measure,
        measure_meters,
        track_length_meters,
        affected_size_meters,
        -- Calculate lower bound (start of affected area)
        -- Subtract half the affected size from the observation point
        GREATEST(0, (measure_meters - (affected_size_meters / 2)) / track_length_meters) as lower_measure,
        -- Calculate upper bound (end of affected area)
        -- Add half the affected size to the observation point
        LEAST(1, (measure_meters + (affected_size_meters / 2)) / track_length_meters) as upper_measure
    FROM event_measures
)
SELECT
    obs_id,
    track_id,
    -- Create line segment using ST_LineSubstring
    ST_LineSubstring(
        track_geom,
        lower_measure,
        upper_measure
    ) as geom,
    ROUND(measure::numeric, 4) as center_measure,
    ROUND(lower_measure::numeric, 4) as start_measure,
    ROUND(upper_measure::numeric, 4) as end_measure,
    ROUND(measure_meters::numeric, 2) as center_meters,
    ROUND((lower_measure * track_length_meters)::numeric, 2) as start_meters,
    ROUND((upper_measure * track_length_meters)::numeric, 2) as end_meters,
    ROUND(affected_size_meters::numeric, 2) as segment_length_meters
FROM segment_measures;

-- Add primary key and spatial index
ALTER TABLE myschema.track_segments ADD COLUMN segment_id SERIAL PRIMARY KEY;
CREATE INDEX track_segments_geom_idx ON myschema.track_segments USING GIST (geom);

-- View the results
SELECT * FROM myschema.track_segments ORDER BY track_id, start_measure;

obs_id | track_id | center_measure | start_measure | end_measure | center_meters | start_meters | end_meters | segment_length_meters
--------+----------+----------------+---------------+-------------+---------------+--------------+------------+-----------------------
      3 |       19 |         0.0377 |        0.0308 |      0.0446 |         27.42 |        22.42 |      32.42 |                 10.00
      2 |       66 |         0.2049 |        0.1885 |      0.2212 |         62.71 |        57.71 |      67.71 |                 10.00
      1 |      164 |         0.1313 |        0.1084 |      0.1543 |         28.62 |        23.62 |      33.62 |                 10.00

-- Create event_points as a view instead of a table
CREATE OR REPLACE VIEW myschema.v_event_points AS
WITH nearest_tracks AS (
    -- ... same logic as before ...
)
SELECT * FROM nearest_tracks;

-- Create track_segments as a view
CREATE OR REPLACE VIEW myschema.v_track_segments AS
WITH event_measures AS (
    -- ... same logic as before ...
)
SELECT * FROM event_measures;

-- Summary report: Which tracks have the most issues?
SELECT
    t.id as track_id,
    t.name as track_name,
    t.highway,
    COUNT(DISTINCT s.obs_id) as num_issues,
    ROUND(SUM(s.segment_length_meters)::numeric, 2) as total_affected_meters,
    ROUND((SUM(s.segment_length_meters) / ST_Length(t.geom) * 100)::numeric, 2) as percent_affected,
    ROUND(AVG(ep.original_gps_error_meters)::numeric, 2) as avg_gps_error_meters
FROM myschema.tracks t
LEFT JOIN myschema.track_segments s ON t.id = s.track_id
LEFT JOIN myschema.event_points ep ON s.obs_id = ep.obs_id
WHERE s.obs_id IS NOT NULL
GROUP BY t.id, t.name, t.highway, t.geom
ORDER BY total_affected_meters DESC;

track_id |  track_name   | highway | num_issues | total_affected_meters | percent_affected | avg_gps_error_meters
----------+---------------+---------+------------+-----------------------+------------------+----------------------
       19 | Porter Avenue | service |          1 |                 10.00 |             1.38 |                30.24
       66 | Riddle Road   | service |          1 |                 10.00 |             3.27 |                40.05
      164 |               | track   |          1 |                 10.00 |             4.59 |                52.98

CREATE INDEX idx_name ON table_name USING GIST (geom);

Location	Description	M-Value (fraction)	M-Value (meters)
Start	Trailhead	0.0	0m
1/4 way	First bridge	0.25	250m
Middle	Viewpoint	0.5	500m
3/4 way	Water source	0.75	750m
End	Summit	1.0	1000m

Function	What It Does	Example Use
`ST_Distance(geom1, geom2)`	Calculates shortest distance between two geometries	Find how far a GPS point is from a trail
`ST_DWithin(geom1, geom2, distance)`	Returns true if geometries are within specified distance	Filter to only points near trails (within 200m)
`ST_LineLocatePoint(line, point)`	Returns fraction (0-1) where point projects onto line	Calculate where along a trail an observation falls
`ST_LineInterpolatePoint(line, fraction)`	Returns a point at the given fraction along a line	Create a new point snapped to the exact trail location
`ST_LineSubstring(line, start_fraction, end_fraction)`	Returns a segment of a line between two fractions	Create a 10m segment centered on an observation
`ST_Length(line)`	Returns the length of a line in your unit system	Get trail length in meters
`ST_GeometryN(geom, n)`	Extracts the nth geometry from a collection	Ensure we’re working with a single line

Linear referencing events in PostGIS

A beginner's guide to snapping points to lines and describing linear conditions

Table of Contents

Introduction

What is Linear Referencing?

Why is Linear Referencing Useful?

How Linear Referencing Works in PostGIS

Getting Started

Prerequisites

Connecting to Your Database

Understanding the Basics

The Key Concept: M-Values

Essential PostGIS Functions

Practical Examples

Step 1: Exploring Your Data

Step 2: Finding the Nearest Line

Step 3: Calculating Measures

Step 4: Creating Snapped Points

Step 5: Building Linear Segments

Real-World Application

Common Mistakes to Avoid

Next Steps

Additional Resources